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Michael Beißwenger 

Das Wissenschaftliche Netzwerk 
„Empirische Erforschung internetbasierter 
Kommunikation“: Themen, Projekte und 
Ergebnisse 


Der vorliegende Band präsentiert Ergebnisse aus Forschungsarbeiten, die im 
Zusammenhang mit dem wissenschaftlichen Netzwerk „Empirische Erfor- 
schung internetbasierter Kommunikation“ (Empirikom) entstanden sind, das 
von 2010 bis 2014 von der Deutschen Forschungsgemeinschaft (DFG) gefördert 
wurde. 

Am Netzwerk beteiligt waren 15 Mitglieder aus Linguistik, Computerlinguis- 
tik, Informatik und Psychologie sowie 23 assoziierte Mitglieder und Kooperati- 
onspartner mit einem gemeinsamen Interesse an Fragestellungen im Zusam- 
menhang mit der empirischen, ressourcengestützten Analyse von Sprachdaten 
aus Formen internetbasierter Kommunikation (IBK). Darunter wurden solche 
Formen der Sprachverwendung subsumiert, die dialogisch und interaktional 
organisiert sind und für deren Zustandekommen Computernetze die infrastruk- 
turelle Voraussetzung darstellen. Prominente IBK-Formen sind Chats, News- 
groups und Online-Foren, Weblog-Kommentare, Tweets, Wikipedia-Diskussio- 
nen, SMS-, WhatsApp- und Instant-Messaging-Interaktionen, Skype sowie ent- 
sprechende Kommunikationsfunktionen in sozialen Netzwerken, Online- 
Computerspielen und ,virtuellen Welten’. IBK-Formen bilden eine wichtige 
Komponente vieler Social-Media-Anwendungen und werden insbesondere in 
den letzten Jahren immer stärker auch mobil genutzt.! 


1 Zur terminologischen Konzeptualisierung des Gegenstands gibt es in der Forschungsliteratur 
unterschiedliche Vorschläge. Am ältesten und nach wie vor verbreitetsten ist die Etikettierung 
als computer-mediated communication (CMC, z. B. Herring 1996), ins Deutsche lehnübersetzt 
als Computervermittelte Kommunikation. Der Terminus Internetbasierte Kommunikation (IBK, 
z. B. Beißwenger et al. 2004) wurde um die Jahrtausendwende als zeitgemäßere Alternative zu 
CMC geprägt und grenzt die Kommunikation auf Basis von TCP/IP von anderen Formen com- 
putervermittelter Kommunikation ab (Auch Briefe und Telefongespräche werden heutzutage 
unter Beteiligung von Computern vermittelt). Jucker/Dürscheid (2012) schlagen die Bezeich- 
nung Keyboard-to-screen-Kommunikation vor, die die Spezifik der Ein-/Ausgabedimension 
fokussiert. Auch die Beiträge des vorliegenden Bandes verwenden variierende Bezeichnungen. 
Die Wahl des Terminus Internetbasierte Kommunikation für die Namensgebung des Netzwerks 
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Im Rahmen von sieben Netzwerktagungen, zweier thematischer Sektionen 
bei der Jahrestagung 2013 der Deutschen Gesellschaft für Sprachwissenschaft 
(DGfS) (Thema: „Modellierung nicht-standardisierter Schriftlichkeit“) und bei 
der Jahrestagung 2013 der Gesellschaft für Sprachtechnologie und Computerlin- 
guistik (GSCL) (Thema: „Verarbeitung und Annotation von Sprachdaten aus 
Genres internetbasierter Kommunikation“) sowie eines internationalen Work- 
shops zum Thema „Building and Annotating Corpora of Computer-Mediated 
Communication“ behandelten die Netzwerkbeteiligten die folgenden Fragen- 
komplexe: 

— Fragen der datengestützten, linguistischen Modellierung der sprachlichen 
und interaktionalen Besonderheiten in IBK-Genres unter Berücksichtigung 
korpus-, interaktions- und variationslinguistischer Ansätze sowie der Per- 
spektiven von Systementwicklung, Texttechnologie und automatischer 
Sprachverarbeitung; 

— Fragen der Erhebung, Repräsentation und Analyse von IBK-Korpora auf der 
Grundlage von Standards im Bereich der Korpuslinguistik und der Digital 
Humanities; 

— Fragen der Erhebung, Repräsentation und Analyse multimodaler Daten zu 
Nutzeraktivitäten beim Umgang mit digitalen Kommunikationstechnolo- 
gien (Eyetracking- und Keylogging-Methoden); 

— Fragen der Anpassung sprachtechnologischer Verfahren und Ressourcen 
für die linguistische Annotation von Phänomenen ,nicht-standardisierter 
Schriftlichkeit‘ in IBK-Daten. 


Die Bearbeitung dieser Thematiken erfolgte unter verschiedenen Perspektiven: 

1) In individuellen Forschungsprojekten der Netzwerkbeteiligten mit IBK- 
Bezug wurden Problemaufrisse und Desiderate zu den o.a. Fragenkomple- 
xen formuliert, an Projektdaten exemplifiziert und im Netzwerk zur Diskus- 
sion gestellt. 

2) Ausgehend von Problemstellungen und Datenbeispielen aus den Projekten 
wurden im Rahmen der Netzwerkveranstaltungen gemeinsam mit eingela- 
denen Gästen und aus unterschiedlichen disziplinären und theoretischen 
Perspektiven Lösungsansätze sondiert. 

3) Ausgehend von den erarbeiteten Problemaufrissen und Lösungsvorschlä- 
gen wurden aus dem Kreis der Netzwerkbeteiligten neue Forschungsprojek- 
te und Initiativen auf den Weg gebracht, um die entsprechenden Desiderate 


ist forschungspraktisch motiviert und schließt nicht aus, dass der Gegenstand auch anders 
terminologisiert werden kann (und wird). 
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in einem Projektkontext bzw. unter Einbeziehung einer breiteren (auch in- 
ternationalen) Fachgemeinschaft weiter zu bearbeiten. 


Die Beiträge dieses Bandes behandeln Fragestellungen, Analyseansätze und 

Ergebnisse im Zusammenhang mit den beschriebenen Desideraten. Ein Teil der 

Arbeiten geht dabei auf Forschungsprojekte zurück, die von den Autorinnen 

und Autoren im Zusammenhang mit dem Netzwerk bearbeitet oder als Beiträge 

auf Tagungen des Netzwerks präsentiert wurden (Dietterle et al., Imo, Jacobs 
et al., Spinuzzi). Andere Arbeiten stehen im Zusammenhang mit Projekten, die 
aus dem Netzwerk hervorgegangen sind oder die auf Ergebnissen des Netzwerks 
aufbauen (Beißwenger et al., Kienle et al., Pappert). Die Bandbreite der be- 
handelten Themen spiegelt dabei einerseits die Bandbreite an Forschungsper- 
spektiven zum Gegenstand und andererseits das Spektrum an methodischen 

Fragestellungen in einem ungemein produktiven Forschungsfeld. Dieses kann 

zum Stand 2017 zwar auf gut 25 Jahre Forschungsgeschichte zurückblicken; für 

seine weitere Konsolidierung sind aber nach wie vor verschiedene Grundlagen- 
fragen zu klären, die aus dem Gegenstand selbst erwachsen und die mit der 

Produktion und Präsentation von sowie dem Umgang mit Sprachdaten unter 

den Bedingungen digitaler Vermittlung zu tun haben. Die Beiträge behandeln 

die folgenden Themen: 

— Michael Beißwenger, Harald Lüngen, Jan Schallaböck, John H. Weitz- 
mann, Axel Herold, Pawel Kamocki, Angelika Storrer und Julia Wild- 
gans beschreiben am Beispiel eines Rechtsgutachtens zur Integration des 
Dortmunder Chat-Korpus in die Ressourceninfrastrukturen von CLARIN-D 
die komplizierte rechtliche Situation in Bezug auf die Bereitstellung von 
IBK-Korpora und zeigen, wie das Ergebnis der juristischen Begutachtung 
bei der Remodellierung des Korpus im Rahmen eines CLARIN-D-Kurations- 
projekts berücksichtigt wurde. 

— Burkhard Dietterle, Anke Lüdeling und Marc Reznicek diskutieren An- 
sätze für die Beschreibung der syntaktischen Struktur von Chat-Beiträgen 
und präsentieren Ergebnisse aus dem Projekt „Linguistische Annotation 
von Nichtstandardvarietäten“, das begleitend zum Netzwerk als Kurations- 
projekt im Rahmen von CLARIN-D gefördert wurde. 

— Wolfgang Imo entwickelt ausgehend von der Konzeption der Interaktiona- 
len Linguistik (Couper-Kuhlen & Selting 2000) die Grundlagen für einen 
Ansatz zur qualitativen Analyse von Sprachdaten aus IBK-Genres und dis- 
kutiert am Beispiel von Fallstudien zur SMS- und Foren-/Usenetkommuni- 
kation sowie zu Online-Gemeinschaften die Leistung des Ansatzes für die 
empirische Erforschung internetbasierter Kommunikation. 
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Eva-Maria Jakobs, Claas Digmayer und Bianka Trevisan diskutieren am 
Beispiel von Fragestellungen und Methoden aus den Aachener Projekten 
„HUMIC“ und „OpenISA“, wie die Sprachverwendung in IBK-Genres in Ab- 
hangigkeit zu Gebrauchsmustern, Themen, Handlungskontexten und Nut- 
zertypen variiert, und zeigen am Beispiel von Blogkommentaren sowie ei- 
nes Open-Innovation-Portals, dass unterschiedliche IBK-Genres unter- 
schiedliche Ansätze für die Datenerhebung und -analyse erfordern. 

Andrea Kienle, Michael Beißwenger, Linda Cedli, Torsten Holmer, 
Philipp Schlieker-Steens und Christian Schlösser geben einen Überblick 
über Fragestellungen und Methoden im DFG-Projekt „Ebiss“, in dem Eye- 
tracking-Methoden für die Rekonstruktion von Besonderheiten des Interak- 
tionsmanagements in synchroner Schriftkommunikation und für die Ent- 
wicklung innovativer Chat-Systeme eingesetzt werden. 

Steffen Pappert entwickelt auf der Grundlage qualitativer Analysen und in 
Anknüpfung an Arbeiten aus dem Netzwerk zur Analyse von Emoticons 
(Beißwenger et al. 2012, Imo 2015) einen Vorschlag für eine pragmatische 
Klassifikation von Emoji-Verwendungen in WhatsApp-Interaktionen und 
formuliert auf dem Hintergrund der Interaktionalen Stilistik (Sandig 1995) 
Perspektiven für die weitergehende Erforschung von Emojis als ikonostilis- 
tisch realisierter Kontextualisierungshinweise. 

Clay Spinuzzi diskutiert, wie sich mit Methoden der Feldforschung und mit 
dem Ansatz der Writing, Activity, and Genre Research die Integration von 
IBK-Technologien in Arbeitskontexte sowie die Komplexität von digital ge- 
prägten Arbeitsumgebungen darstellen lässt. Am Beispiel einer Fallstudie 
wird die Anwendung analytischer Konstrukte aus dem Ansatz vorgeführt. 


Ich danke der Deutschen Forschungsgemeinschaft für die Förderung des wis- 
senschaftlichen Netzwerks, das den Rahmen für eine Reihe von Projekten und 
Initiativen bereitet hat, in denen die Entwicklung von Lösungen für den Aufbau 
und die empirische Analyse von IBK-Ressourcen fortgeführt wird. Zu nennen 
sind: 


die computerlinguistische Community-Shared-Task „Automatic Linguistic 
Annotation of Computer-Mediated Communication / Social Media“ (Empi- 
riST, 2014-2016), in der, unterstützt durch die GSCL, Ansätze für die Anpas- 
sung von sprachtechnologischen Verfahren des Part-of-speech-Tagging an 
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die sprachlichen Besonderheiten von Korpora internetbasierter Kommuni- 
kation und von Webkorpora vergleichend evaluiert wurden;? 

— der GSCL-Arbeitskreis „Internetbasierte Kommunikation / Social Media“, 
der seit 2014 drei Workshops zum Thema „Natural language processing for 
computer-mediated communication and social media (NLP4CMC)“ ausge- 
richtet hat;? 

— die Special Interest Group (SIG) „Computer-mediated communication“ im 
Rahmen der Text Encoding Initiative (TEI)*, die seit 2013 verschiedene TEI- 
Extensionen für die Repräsentation und Strukturannotation von Sprachda- 
ten aus IBK-Genres vorgelegt hat und die derzeit einen Vorschlag für einen 
TEI-Standard zu diesem Datentyp vorbereitet;° 

— die internationale Konferenzreihe „Conference on CMC and Social Media 
Corpora“ (cmc-corpora)° mit bislang fünf Veranstaltungen in Deutschland 
(2013, 2014), Frankreich (2015), Slowenien (2016) und Italien (2017).7 


Weitere Projekte und Aktivitäten sowie zentrale Ergebnisse und Publikationen 

aus dem Netzwerk sind auf der Website http://www.empirikom.net doku- 
mentiert. 

Essen, im Juli 2017 

Michael Bei& wenger 


2 Die Ergebnisse dieses Projekts, das im Empirikom-Netzwerk konzipiert wurde, wurden 2016 
als Teil des 10. Web-as-corpus-Workshops im Rahmen der ACL-Konferenz in Berlin präsentiert. 
Das Design und die Resultate der Shared Task sowie die teilnehmenden Systeme sind in einem 
Proceedings-Band publiziert (WAC-X/EmpiriST 2016). Sämtliche Ressourcen aus dem Projekt 
stehen auf der Projekt-Website zur Verfiigung (https://sites.google.com/site/empirist2015/). 

3 Dokumentation und Proceedings: https://sites.google.com/site/nlp4cmc/ (2014), 
https://sites.google.com/site/nlp4cmc2015/ (2015), 
https://sites.google.com/site/nlp4cmc2016/ (2016). 

4 http://www.tei-c.org/Activities/SIG/CMC/ 

5 Die von der SIG erarbeiteten TEI-Extensionen sind über das TEI-Wiki zugänglich 
(https: //wiki.tei-c.org/index.php?title=SIG:CMC). Die aktuellste Version, die in Form eines 
RNG-Schemas und eines ODD-Dokuments zur Verfügung steht, wurde 2015/16 im Rahmen des 
CLARIN-D-Kurationsprojekts ChatCorpus2CLARIN entwickelt und an Daten aus verschiedenen 
IBK-Genres getestet (https: //wiki.tei-c.org/index.php?title=SIG:CMC/clarindschema). 

6 http://cmc-corpora.org/ 

7 Einen Überblick über das Themenspektrum der Konferenzen bieten die Online-Proceedings 
der 2016er Konferenz (http://nl.ijs.si/janes/cmc-corpora2016/proceedings/) sowie drei referier- 
te, internationale Sammelbände, die in der Folge der Konferenzen 2013 in Dortmund, 2015 in 
Rennes und 2016 in Ljubljana erarbeitet wurden (Beißwenger et al. 2014, Wigham/Ledegen 
2017, FiSer/Beißwenger 2017). 
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Michael Beißwenger, Harald Lüngen, Jan Schallaböck, 
John H. Weitzmann, Axel Herold, Pawel Kamocki, 
Angelika Storrer und Julia Wildgans 


Rechtliche Bedingungen für die Bereit- 
stellung eines Chat-Korpus in CLARIN-D: 
Ergebnisse eines Rechtsgutachtens 


1 Einleitung 


Korpora zur Sprachverwendung in der internetbasierten Kommunikation, die 
frei für Forschung, Lehre und Sprachdokumentation zur Verfügung stehen, sind 
in der deutschen und internationalen Sprachressourcenlandschaft nur sehr 
begrenzt vorhanden. Zugleich besteht in den Bereichen Linguistik, Sprachver- 
mittlung und Sprachtechnologie - allgemeiner in allen Bereichen der digitalen 
Geistes- und Sozialwissenschaften, die sich empirisch und sprachdatenbasiert 
mit Tendenzen der deutschen Gegenwartssprache und mit Phänomenen im 
Social Web beschäftigen - ein großer Bedarf an hochwertigen, für Recherche- 
zwecke aufbereiteten Sprachressourcen. Wesentliche Gründe für die geringe 
Zahl an frei verfügbaren Ressourcen liegen im Fehlen von Standards für die 
Erhebung, Dokumentation, Repräsentation und Annotation von Sprachdaten 
aus Genres wie Chats, Online-Foren, Newsgroups, sozialen Netzwerken, Tweets, 
Weblogs oder mobilen Messaging-Anwendungen wie SMS und WhatsApp. Auch 
sind Anwendungen im Bereich des Natural Language Processing (NLP) bislang 
nur begrenzt in der Lage, Daten dieses Typs zu verarbeiten und automatisch mit 
linguistischen Annotationen zu versehen. 

In den letzten Jahren gibt es zu verschiedenen dieser Desiderate eine rege, 
interdisziplinär ausgerichtete Forschung, die sich mit der Entwicklung von 
Standards für die Repräsentation und Annotation und mit der Anpassung von 
sprachtechnologischen Verfahren für den Bereich der internetbasierten Kom- 
munikation bzw. den Sprachgebrauch in sozialen Medien befasst.’ Lösungsvor- 


1 Das DFG-Netzwerk Empirikom hat in verschiedener Hinsicht einen Beitrag dazu geleistet, 
Lösungen für deutschsprachige Korpora zu entwickeln, u.a. durch die Initiierung einer Sprecial 
Interest Group zum Thema in der Text Encoding Initiative (TEI, http://tei-c.org) sowie durch 
die Konzeption und Durchführung einer computerlinguistischen Community Shared Task zur 
automatischen linguistischen Annotation von Sprachdaten internetbasierter Kommunikation 
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schläge und Best Practices, die gegenwärtig in verschiedenen Projekten und für 
verschiedene Sprachen erarbeitet werden, lassen erwarten, dass sich die Rah- 
menbedingungen für die Erhebung, Repräsentation und linguistische Annotati- 
on von Korpora internetbasierter Kommunikation in den nächsten Jahren sicht- 
bar verbessern werden. 

Ein Desiderat, zu dem nach wie vor wenig gesichertes Wissen und keine 
Standards existieren, betrifft die Frage nach dem rechtlichen Status von 
Sprachdaten aus internetbasierten Kommunikationsumgebungen und nach den 
rechtlichen Rahmenbedingungen für deren Erhebung, Speicherung, Bearbei- 
tung (Aufbereitung, Annotation) und Wiederbereitstellung in Form frei zugäng- 
licher Korpusressourcen. Für die Klärung dieser Fragen fehlt Linguisten, Kor- 
pus- und Computerlinguisten die erforderliche juristische Expertise; zugleich 
sind Juristen typischerweise nicht am Aufbau von Sprachkorpora beteiligt. 

Im vorliegenden Beitrag berichten wir über die Ergebnisse eines Rechtsgut- 
achtens, das im Zusammenhang mit der Integration eines existierenden Korpus 
zur deutschsprachigen Chat-Kommunikation — des Dortmunder Chat-Korpus - 
in die Korpusinfrastrukturen von CLARIN-D durch die Anwaltskanzlei iRi- 
ghts.law erarbeitet wurde. Das vom Bundesministerium für Bildung und For- 
schung (BMBF) geförderte Verbundprojekt CLARIN-D? zielt auf den Aufbau und 
die Verstetigung einer digitalen Forschungsinfrastruktur für Sprachressourcen 
in den Geistes- und Sozialwissenschaften. Das Rückgrat der Infrastruktur bildet 
ein Verbund von Zentren, zu denen u.a. die Berlin-Brandenburgische Akademie 
der Wissenschaften (BBAW) und das Institut für Deutsche Sprache (IDS) in 
Mannheim gehören. CLARIN-D ist das deutsche Partnerprojekt der europäi- 
schen CLARIN-Initiative (European Research Infrastructure for Language Re- 
souces and Technology’), an dem 19 Länder mit Partnerprojekten beteiligt sind. 

Die Integration des Dortmunder Chat-Korpus in die CLARIN-D-Infrastruk- 
turen war Gegenstand eines sog. Kurationsprojekts, das aus Mitteln des Ver- 
bundprojekts finanziert wurde und in dem am Beispiel des Chat-Korpus Lösun- 
gen für die Erweiterung bestehender Korpusinfrastrukturen zum Deutschen um 
Korpusressourcen zur internetbasierten Kommunikation erarbeitet wurden. 
Eine zentrale Voraussetzung für die Arbeiten im Projekt bildete die Klärung der 


(http://sites.google.com/site/empirist2015/). Einen aktuellen Überblick über Entwicklungen 
und Projekte zum Aufbau und zur Analyse von Korpora internetbasierter Kommunikation für 
diverse Genres und für verschiedene europäischen Sprachen bietet der Konferenzband Fišer & 
Beißwenger (2016). 

2 http://www.clarin-d.de 

3 https://www.clarin.eu/ 
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Frage, ob bzw. unter welchen Bedingungen eine Aufnahme des Chat-Korpus in 
CLARIN-D rechtlich unbedenklich ist. 

In ihrem Gutachten beurteilten die beiden Gutachter das Korpus unter da- 
tenschutzrechtlicher, persönlichkeitsrechtlicher, urheber- und leistungsschutz- 
rechtlicher Perspektive. Die dazu formulierten Einschätzungen beziehen sich 
zwar spezifisch auf das Dortmunder Chat-Korpus - d.h. auf eine Korpusres- 
source, die bereits vollständig erhoben vorlag und nachträglich in die CLARIN- 
D-Infrastrukturen integriert werden sollte -, die im Gutachten formulierten 
srundsätzlichen Erwägungen sind aber über den konkreten Fall hinausgehend 
interessant, um ein Bild von der komplexen rechtlichen Situation in Bezug auf 
die Bereitstellung von Sprachdaten aus Genres internetbasierter Kommunikati- 
on in Korpora zu gewinnen. 

Der vorliegende Beitrag gibt zunächst einen Überblick über Ziele, Arbeits- 
pakete und Ergebnisse das CLARIN-D-Kurationsprojekts (Abschnitt 2) und an- 
schließend eine ausführliche Zusammenfassung der wesentlichen Ergebnisse 
des Rechtsgutachtens in allgemeinverständlicher Form (Abschnitt 3). In Ab- 
schnitt 4 wird dargestellt, wie im Projekt ausgehend von den Empfehlungen des 
Rechtsgutachtens die Korpusdaten für die Integration und Bereitstellung ano- 
nymisiert und lizenziert wurden. 


2 Überblick über das CLARIN-D- 
Kurationsprojekt ChatCorpus2CLARIN 


Den Hintergrund für das in diesem Beitrag beschriebene Rechtsgutachten bildet 
das Projekt ChatCorpus2CLARIN, das im Zeitraum Mai 2015 bis Februar 2016 
unter Leitung von Michael Beißwenger (Dortmund) und Angelika Storrer 
(Mannheim) an der Universität Mannheim durchgeführt wurde. Ziel des Projekts 
war es, die Daten eines existierenden Korpus internetbasierter Kommunikation 
(des Dortmunder Chat-Korpus, Beißwenger 2013), für die CLARIN-D-Infrastruk- 
tur aufzubereiten, an aktuelle Annotations- und Repräsentationsstandards im 
Bereich der Digital Humanities anzupassen und über die Korpusschnittstellen 
der CLARIN-Zentren am Institut für Deutsche Sprache (IDS) in Mannheim und 
an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) zu- 
gänglich zu machen. Das Projekt wurde als Kurationsprojekt im Rahmen von 
CLARIN-D vom Bundesministerium für Bildung und Forschung (BMBF) geför- 
dert. Als zentrale Projektverantwortliche an den beiden CLARIN-D-Zentren wirk- 
ten für die BBAW Axel Herold und für das IDS Harald Lüngen mit. Als Projekt- 
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mitarbeiter war Eric Ehrhardt (Universität Mannheim) beteiligt. Daneben brach- 

ten Thomas Schmidt und Swantje Westpfahl (IDS, Abt. Pragmatik) als Koopera- 

tionspartner Expertise an der Schnittstelle zu Korpora gesprochener Sprache 

(Forschungs- und Lehrkorpus gesprochenes Deutsch, FOLK) in das Projekt ein. 
Durch eine Remodellierung des Korpus auf Basis der Formate der Text En- 

coding Initiative (TEI), die Anreicherung um zusätzliche morphosyntaktische 

Annotationen sowie die Integration in CLARIN-D sollte der Zugriff auf die Res- 

source verbessert und sollten Nutzerinnen und Nutzern aus dem Bereich der 

germanistischen Linguistik und Computerlinguistik sowie aus dem Bildungs- 
sektor (Sprachdidaktik, Lehramt Deutsch) erweiterte Recherche- und Analyse- 
möglichkeiten an die Hand gegeben werden. Die Herstellung von Kompatibilität 
mit Standardformaten sollte die Interoperabilität der Ressource mit anderen 

Sprachressourcen verbessern; die Anpassung einer Annotationsumgebung 

sollte die Möglichkeiten des Einsatzes in der Lehre erweitern und es Nutzerin- 

nen und Nutzern aus den genannten Bereichen ermöglichen, die in der Res- 
source vorhandenen Annotationen individuell anzupassen. 
Das Projekt konnte auf die folgenden Vorarbeiten aufbauen: 

— Integration von Korpusressourcen in die CLARIN-D-Infrastrukturen: Als Zen- 
tren verfügen die Arbeitsgruppenmitglieder am IDS und an der BBAW über 
die Expertise und die benötigten Technologien für die Integration neuer 
Sprachressourcen in die CLARIN-D-Infrastrukturen. Diese Voraussetzungen 
wurden für die Ausarbeitung der Zielformate (TEI, Repräsentation von mor- 
phosyntaktischen Informationen), für die Konvertierung der Ressource, für 
die Langzeitarchivierung und für die Integration in die Korpusschnittstellen 
am IDS und an der BBAW genutzt. 

—  TEI-Modellierung: Die Remodellierung der Ressource in einem TEI-Format 
konnte auf Vorarbeiten zur TEI-Repräsentation von Korpora in CLARIN-D- 
Infrastrukturen (Lüngen/Sperberg-McQueen 2012) sowie von Genres inter- 
netbasierter Kommunikation aufbauen, die von den Arbeitsgruppenmit- 
gliedern im Rahmen des Korpusvorhabens DeRiK und des DFG-Netzwerks 
Empirikom sowie in Kooperation mit internationalen Partnern im Rahmen 
der Special Interest Group „Computer-Mediated Communication” der TEI- 
Initiative (TEI-CMCSIG) durchgeführt wurden (vgl. Beißwenger et al. 2012, 
Chanier et al. 2014, Margaretha/Lüngen 2014). 

— Morphosyntaktische Annotation: Für die Anreicherung der Ressource mit 
zusätzlichen morphosyntaktischen Annotationen (Parts of speech) konnte 
auf Ergebnisse aus der CLARIN-D-Initiative zur Erweiterung des „Stuttgart- 
Tübingen-Tagsets” STTS (Schiller et al. 1999) um Kategorien u.a. für Genres 
„nichtstandardisierter Schriftlichkeit” zurückgegriffen werden (vgl. Zins- 
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meister et al. 2014, speziell zur Anpassung von STTS an die Besonderheiten 
internetbasierter Kommunikation Bartz et al. 2014). Als Ziel-Tagset konnte 
im Projekt das erweiterte STTS-Tagset aus EmpiriST2015, einer von der Ge- 
sellschaft für Sprachtechnologie und Computerlinguistik (GSCL) geförder- 
ten Shared Task zur automatischen linguistischen Verarbeitung internetba- 
sierter Kommunikation (Beißwenger et al. 2016), genutzt werden, das eine 
Weiterentwicklung der in der STTS-Arbeitsgruppe diskutierten Tagset- 
Entwürfe darstellt (‚STTS_IBK’, Beißwenger et al. 2015). In das Ziel-Tagset 
ist maßgeblich auch Expertise aus dem FOLK-Projekt der Abteilung Prag- 
matik am IDS eingeflossen, deren Mitarbeiter ebenfalls - für die morpho- 
syntaktische Annotation gesprochener Sprache -— an der CLARIN-D- 
Arbeitsgruppe zur Erweiterung von STTS beteiligt waren (vgl. Westpfahl 
2014, Westpfahl/Schmidt 2016). Für die automatische Part-of-speech- 
Annotation konnten Werkzeuge aus einer Kooperation des IDS mit der 
Universität des Saarlandes im Rahmen des BMBF-Projekts www.schreib 
gebrauch.de genutzt werden, die bereits auf die Verarbeitung von Korpora 
internetbasierter Kommunikation angepasst waren (Horbach et al. 2014). 
Rechtsgutachten: Der Auftrag für die Erstellung des Rechtsgutachtens zu 
den Bedingungen der Integration der Ressource wurde auf Vorschlag des 
CLARIN-D LegalHelpDesk an die Anwaltskanzlei iRights.law erteilt. Die 
Kanzlei iRights.law (John Weitzmann u.a.) ist spezialisiert auf Rechtsfragen 
im Zusammenhang mit digitalen Medien und dem Internet und kooperiert 
bereits seit einigen Jahren mit CLARIN-D, beispielsweise bei der Erstellung 
der DFG-Handreichung zu rechtlichen Aspekten bei der Handhabung von 
Sprachkorpora (2015). 


Auf dieser Grundlage wurden die folgenden wesentlichen Ergebnisse erzielt: 


Repräsentation der Ressource in einem TEI-Format: Das komplette Korpus 
wurde in TEI remodelliert. Das dafür im Projekt entwickelte Repräsentati- 
onsschema (,CLARIN-D TEI-CMC’) erfasst sämtliche Strukturinformationen 
und Metadaten, die in der XML-Annotation der Ausgangsressource enthal- 
ten waren, ist kompatibel mit den im DWDS-Projekt und in DEREKo verwen- 
deten TEI-Schemata und stellt eine Weiterentwicklung der TEI-Modelle aus 
der TEI-CMCSIG dar.’ 


4 Das Schema ist in Form eines ODD-Dokuments im TEI-Wiki dokumentiert und wird als RNG- 
Datei zur Verfügung gestellt: http://wiki.tei-c.org/index.php?title=SIG:CMC/clarindschema. Es 
fließt in weitere Arbeit der TEI-CMCSIG zur Ausarbeitung eines TEI-Standards für die Repräsen- 
tation von Genres internetbasierter Kommunikation ein. 
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— Morphosyntaktische Annotation: Das komplette Korpus wurde mit den 
Sprachverarbeitungswerkzeugen aus dem Projekt www.schreibgebrauch.de 
morphosyntaktisch annotiert und auf die Kategorien des Ziel-Tagsets 
‚STTS_IBK’ angepasst. Ein Ausschnitt mit einem Umfang von 4.339 Token 
wurde von zwei MitarbeiterInnen des Kurationsprojekts manuell nachkorri- 
giert. Für die manuelle Nachannotation wurde eine von Thomas Schmidt 
für XML-strukturierte Chat-Daten angepasste Version der Annotationsum- 
gebung OrthoNormal (Schmidt 2014) genutzt. 

— Integration der Ressourcen in CLARIN-D: Die Zielressource wurde in den 
Repositories an der BBAW und am IDS archiviert? und kann über die Kor- 
pusrecherchesysteme des DWDS-Portals® und des DEREKO-Projekts’ (COS- 
MAS II bzw. künftig KorAP) vergleichend mit den in den Korpussammlun- 
gen an der BBAW und am IDS vorhandenen Sprachressourcen (Textkorpora 
sowie weitere Korpora internetbasierter Kommunikation: Blog-Korpus, Wi- 
kipedia-Korpus, Usenet-Korpus) abgefragt und analysiert werden. 

— Rechtsgutachten und Konsequenzen: Das von iRights.law besorgte Rechts- 
gutachten liefert klare Empfehlungen zur Lizenzierung der Zielressource 
und zur Überführung der Daten in ein Format, bei dessen Bereitstellung aus 
rechtlicher Sicht die Risiken so weit reduziert sind, dass die Rechtsabtei- 
lungen der beiden CLARIN-D-Zentren bzw. das CLARIN-D LegalHelpDesk 
die Integration für unbedenklich hielten. Zur Umsetzung der Empfehlungen 
des Gutachtens war eine aufwändige, großenteils manuell durchgeführte 
Anonymisierung der Daten erforderlich, die im Anschluss an die eigentliche 
Projektlaufzeit nach Vorgabe von Harald Lüngen von studentischen Hilfs- 
kräften durchgeführt wurde, die aus Eigenmitteln der Projektleiter finan- 
ziert wurden. Die anonymisierte und um ein (kleines) Teilkorpus reduzierte 
Version der Ziel-Ressource ist ab September 2017 über die o.g. Korpus- 
recherchesysteme abfragbar. 


Die folgenden Abschnitte präsentieren eine Darstellung des Rechtsgutachtens 
und der daraus gezogenen Konsequenzen. Eine ausführliche Beschreibung der 
Arbeitsschritte bei der Remodellierung, Annotation und Integration des Korpus 
in CLARIN-D sowie der dafür entwickelten Lösungen bietet Lüngen et al. (2016). 


5 BBAW: http://hdl.handle.net/11858/00-203Z-0000-002D-EC85-5, 
IDS: http://hdl.handle.net/10932/00-0379-FDFE-CC30-0301-E 

6 https://www.dwds.de 

7 http://www.ids-mannheim.de/dereko 
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3 Rechtliche Bewertung der Ressource mit Blick 
auf die Integration in CLARIN-D 


Gegenstand des Rechtsgutachtens, das im Auftrag des Projekts von der Kanzlei 
iRights.law (John H. Weitzmann und Jan Schallaböck) erstellt wurde, ist die 
Bewertung der rechtlichen Rahmenbedingungen für die Integration der 
Ausgangsressource in die CLARIN-D-Korpusinfrastrukturen am Institut für 
Deutsche Sprache (IDS), Mannheim, und an der Berlin-Brandenburgischen 
Akademie der Wissenschaften (BBAW, Portal www.dwds.de). iRights.law ist 
spezialisiert auf Rechtefragen im Zusammenhang mit digitalen Medien und dem 
Internet und kooperiert bereits seit einigen Jahren mit CLARIN-D, beispielsweise 
bei der Erstellung der DFG-Handreichung zu rechtlichen Aspekten bei der 
Handhabung von Sprachkorpora (2014). 

Die Grundlage für das Rechtsgutachten bildete eine vom Projekt zur Verfü- 
gung gestellte Beschreibung der in der Ausgangsressource vorhandenen Teil- 
korpora mit Erläuterungen zur Herkunft der Daten und zu den Bedingungen 
ihrer Erhebung und Eingliederung in das Korpus. Darüber hinaus wurden von 
den Gutachtern stichprobenartig Datenstücke aus den verschiedenen Teilkorpo- 
ra gesichtet. Den rechtlichen Rahmen für das Gutachten bilden die Regeln zum 
Datenschutz, zu Persönlichkeitsrechten sowie das Urheberrecht. 

Die Gutachter weisen grundsätzlich darauf hin, dass eine verlässliche Prog- 
nose der Rechtslage nur bedingt möglich sei, da eine Vielzahl der im Gutachten 
behandelten Fragestellungen sowohl in datenschutzrechtlicher als auch in 
urheber- und leistungsschutzrechtlicher Hinsicht bisher nicht höchstrichterlich 
entschieden seien. Die Empfehlungen des Gutachtens zur Behandlung der Kor- 
pusdaten basieren auf einer Abschätzung der rechtlichen Risiken. 


3.1 Beschreibung der Ausgangsressource 


Die Ausgangsressource für das Projekt bildete das Dortmunder Chat-Korpus, 
eine Sammlung von Chat-Mitschnitten aus vier verschiedenen sozialen Hand- 
lungsbereichen (Freizeit, Bildung, Beratung, Medien) im Umfang von 478 Do- 
kumenten. Jedes Dokument enthält einen Chat-Mitschnitt. Die Gesamtgröße des 
Korpus beträgt 140.240 Chatter-Beiträge bzw. 1,06 Mio. Tokens. Das Korpus 
wurde 2002-2008 am Lehrstuhl für Linguistik der deutschen Sprache und 
Sprachdidaktik der TU Dortmund aufgebaut und ist in der Germanistischen 
Linguistik und Sprachdidaktik, aber auch im Bereich Computerlinguistik und 
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Sprachtechnologie als Ressource zur Sprachverwendung in der internetbasier- 

ten Kommunikation etabliert.® 

Das Korpus ist in einer einfachen XML-Sprache annotiert, in der zentrale 
Strukturmerkmale von Chat-Mitschnitten erfasst und darüber hinaus ausge- 
wählte Sprach- und Stilmerkmale internetbasierter Kommunikation ausge- 
zeichnet sind (unterschiedliche Beitragstypen, darüber hinaus Emoticons, In- 
flektive, Akronyme, Adressierungen und Nicknames). 383 der insgesamt 478 
Dokumente mit einem Umfang von 59.558 Chat-Beiträgen bzw. 548.067 lfd. 
Wortformen wurden seit unter http://www.chatkorpus.tu-dortmund.de sowohl 
in einer HTML-Version als auch in einer frei downloadbaren XML-Version zur 
Verfügung gestellt, die neben den Korpusdokumenten ein einfaches, Java- 
basiertes Abfragewerkzeug (STACCADo) umfasste. Die nicht in dieser „Release- 
Version“ des Korpus enthaltenen Teilkorpora konnten vor Ort in Dortmund 
genutzt werden. 

Das Korpus gliedert sich in verschiedene Teilkorpora, die unterschiedlichen 
Quellen entstammen und die auf unterschiedliche Weise erhoben wurden. Auf 
oberster Strukturierungsebene entsprechen die Teilkorpora unterschiedlichen 
gesellschaftlichen Handlungsbereichen: 

— Das Teilkorpus „Chats im E-Learning“ umfasst Mitschnitte aus universitä- 
ren Lehrveranstaltungen, die entweder komplett virtuell per Chat oder im 
Blended-Learning-Modus (mit Chat-Anteilen) durchgeführt wurden. Sub- 
korpora repräsentieren Mitschnitte aus unterschiedlichen Lehrveranstal- 
tungen. 

— Das Teilkorpus „Chat-Beratung“ umfasst Mitschnitte aus unterschiedlichen 
Formen chatbasierter Beratungsangebote: von offen zugänglichen, punktu- 
ell durchgeführten Großgruppen-Chats einer Studienberatungsstelle über 
Mitschnitte einer chatbasierten Bibliotheksauskunft, in denen im 1:1-Modus 
(Ratsuchender und Auskunftsmitarbeiter) Fragen rund um die Bibliotheks- 
recherche verhandelt werden, bis hin zu 1:1- und Gruppenchats aus Online- 
Beratungsangeboten zu psychosozialen Themen. 

— Das Teilkorpus „Chats im Medienkontext“ umfasst moderierte Chats mit 
Studiogästen, Politikern und Prominenten, die im Rahmen journalistischer 
Online-Portale als punktuelle Events durchgeführt wurden. Das Spektrum 
reicht von Chats mit Politikern aus einem Online-Portal zu politischen The- 
men über Chats mit Popmusikern, Sportlern und anderen Prominenten in 


8 Vgl. auch den Beitrag von Dietterle, Lüdeling & Reznicek (in diesem Band). 
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einem Freizeit-Portal bis hin zu Chats mit Studiogästen im Anschluss an TV- 
Sendungen. 

— Das Teilkorpus „Plauder-Chats“ umfasst zum einen Mitschnitte aus nicht 
themenbezogenen, unmoderierten Chat-Portalen (Webchats und Internet 
Relay Chat (IRC)) im Freizeitbereich, die in erster Linie der ungezwungenen 
Kontaktanbahnung und dem Zeitvertreib genutzt werden. Zum anderen um- 
fasst das Teilkorpus nicht moderierte Chats in journalistischen Online- 
Portalen („Plauder-Chats im Medienkontext“); dabei handelt es sich i.d.R. 
um freie Chats im Anschluss an die im Teilkorpus „Chats im Medienkon- 
text“ dokumentierten moderierten Chats, bei denen die Teilnehmer ohne 
Moderation - im „Plauder-Modus“ — Themen aus den vorangegangenen 
Events weiterdiskutieren. 


Als Grundlage für das Rechtsgutachten wurde eine 20-seitige Dokumentation 
erstellt, die eine Beschreibung zum Inhalt der einzelnen Teil- und Subkorpora, 
zum Setting der darin dokumentierten Chats (verwendete Chat-Software, The- 
menbezug, Moderation etc.) sowie Angaben zu den Bedingungen der Ersterhe- 
bung der darin enthaltenen Daten umfassen. Beispiele für drei Korpusteile - ein 
Subkorpus aus dem Teilkorpus „Chats im E-Learning“, ein Subkorpus aus dem 
Teilkorpus „Chat-Beratung“, ein Subkorpus aus dem Teilkorpus „Plauder- 
Chats“ - sind nachfolgend wiedergegeben: 


Subkorpus: 1102000 


Kurzbeschreibung: Komplettmitschnitt eines hochschulübergreifenden, virtuellen 
Seminars zum Thema Lexikographie und Wörterbuchbenutzung 
(Wintersemester 2002/03) 


Setting: Hochschulübergreifendes Online-Seminar mit Studierenden und 
Lehrenden dreier deutscher Universitäten. Die Chats waren 
gerahmt durch eine Reihe an Konversationsregeln, die das Inter- 
aktionsmanagement unterstützen und eine kohärente Beitrags- 
abfolge gewährleisten sollten. Diese Regeln wurden den Teil- 
nehmerlnnen in der ersten Sitzung vermittelt wurden. 

Jede Seminarsitzung gliederte sich in eine Großgruppen- 
Interaktion, eine darauf folgende Phase der Kleingruppenarbeit 
und abschließend wieder eine Großgruppen-Interaktion. Die 
Großgruppen-Interaktionen fanden jeweils im Chat-Raum „class- 
room“ statt; für die Kleingruppenarbeit jedoch begaben sich die 
Studierenden jeweils in separate Chat-Räume, die die Namen 
„blue“, „green“ und „red“ trugen. 

Es gab im Chat einen separaten Teachers-Kanal. Postings, die 
über diesen Kanal verschickt wurden, wurden regulär in die 
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Subkorpus: 


Beispiel-Datensatz: 


Größe: 


Herkunft der Daten: 


Einwilligung: 


Subkorpus: 


Kurzbeschreibung: 


Setting: 


1102000 


Logfiles am Bildschirm eingeordnet, waren aber nur für Teilneh- 
mer mit Dozenten-Status sichtbar. Sie sind in den Mitschnitten 
mit dem Zusatz „for teachers“ hinter den Teilnehmernamen 
gekennzeichnet. Postings, die für alle Beteiligten sichtbar waren, 
sind mit „for all“ gekennzeichnet. 

Zum Seminar existierte eine begleitende Website, auf welcher zu 
einzelnen Sitzungen vorab und/oder nachbereitend Materialien, 
Begleittexte und Übungsaufgaben bereitgestellt wurden. 
Verwendetes Chat-System: TULKA 

Der Seminar-Chatraum war nur für TeilnehmerInnen des Semi- 
nars (Lehrende, Studierende) mit gültiger Nutzerkennung zu- 
gänglich. 

Großgruppen-Chat (classroom): http://www.chatkorpus.tu- 
dortmund.de/files/releasehtml/html- 
korpus/seminar_classroom_30-10-2002_a.html 
Kleingruppen-Chat (green): http://www.chatkorpus.tu- 
dortmund.de/files/releasehtml/html-korpus/seminar_green_30- 
10-2002_a.html 


Dokumente: 29 Postings: 4.369 Tokens: 28.860 
Serverseitig erzeugte Mitschnitte sämtlicher Chat-Sitzungen. 


Die Studierenden und Lehrenden der beteiligten Universitäten 
gaben zu Semesterbeginn mündlich ihr Einverständnis, dass die 
Chat-Sitzungen mitgeschnitten und in das in Aufbau befindliche 
Chat-Korpus integriert werden dürfen. Die Studierenden waren 
darüber informiert, dass der Aufbau des Korpus für Forschungs- 
und Lehrzwecke erfolgt und dass die Korpusdaten ForscherInnen 
sowie der sprachinteressierten Öffentlichkeit online zur Verfü- 
gung gestellt werden sollen. 

Die Mitschnitte wurden am Seminar für Sprachwissenschaft der 
Universität Tübingen angefertigt, wo auch der Chat-Server be- 
treut wurde. Das Seminar für Sprachwissenschaft stellte die 
Mitschnitte für die Aufnahme und Bereitstellung im Korpus zur 
Verfügung. 


1203000 


Chatbasierte Bibliotheksauskunft der Universitätsbibliothek Dort- 
mund 


Die Universitätsbibliothek Dortmund bietet unter 
http://www.ub.uni- 
dortmund.de/literatursuche/auskunftonline.html die Möglichkeit, 
per Chat 1:1 mit einem Mitarbeiter der Informationsabteilung in 
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1203000 


Subkorpus: 


Kontakt zu treten. 


Beispiel-Datensatz: 


Größe: 


Herkunft der Daten: 


Einwilligung: 


Anonymisierung: 


http://chatkorpus.tu-dortmund.de/files/releasehtml/html- 
korpus/UB_Gesamt.html 


Postings: 2.452 Tokens: 21.089 


Die Mitschnitte wurden von MitarbeiterInnen der UB Dortmund 
serverseitig erzeugt. 


Dokumente: 200 


Die Mitschnitte wurden vom stellvertretenden Leiter der Universi- 
tatsbibliothek für die Aufnahme in das Korpus zur Verfügung ge- 
stellt. Die Einwilligung erfolgte mündlich. Die Bibliotheksleitung war 
darüber informiert, dass der Aufbau des Korpus für Forschungs- und 
Lehrzwecke erfolgt und dass die Korpusdaten Forscherlnnen sowie 
der sprachinteressierten Öffentlichkeit online zur Verfügung gestellt 
werden sollen. Ggf. kann eine schriftliche Zustimmung zur Wieder- 
bereitstellung im Rahmen von CLARIN-D nachträglich eingeholt 
werden. 


Die Beteiligten sind in den von der UB zur Verfügung gestellten 
Ausgangsdaten nicht mit Klarnamen, sondern mit generischen Rol- 


lenbezeichnungen identifiziert (AUSKUNFT, BENUTZER). 


2221000 


Subkorpus: 


Kurzbeschreibung: 


Freie, unmoderierte Chats in der Webchat-Umgebung „unicum 


Setting: 


Beispiel-Datensatz: 


Größe: 


Herkunft der Daten: 


Einwilligung: 


SpaceChat“ 


Freie, unmoderierte Chats in der frei zugänglichen und öffentlich 
einsehbaren Chat-Umgebung „unicum-SpaceChat“ des Bochumer 
Uni-Magazins unicum (http://www.unicum.de/). Diese Webchat- 
Umgebung existiert seit ca. 10 Jahren nicht mehr. 

Die Chat-Beteiligten konnten ihre Teilnehmernamen (Nicknames) 
frei wählen. 


http://chatkorpus.tu-dortmund.de/files/releasehtml/html- 
korpus/unicum_1998.html („Virtuelle Kreuzfahrt“) 
http://chatkorpus.tu-dortmund.de/files/releasehtml/html- 
korpus/unicum_21-02-2003_1.html 


Dokumente: 12 Postings: 15.481 Tokens: 70.825 


Elf Mitschnitte wurden clientseitig von einer Mitarbeiterin des Kor- 
pus-Projekts angefertigt. Ein Mitschnitt („Virtuelle Kreuzfahrt“) 
wurde von einer Chat-Beteiligten für die Zwecke wissenschaftlicher 
Untersuchung gespendet. 


Keine Einwilligung eingeholt; im Falle des gespendeten Chats hat 


die aufzeichnende Chatterin ihre Einwilligung gegeben, dass der 
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Subkorpus: 2221000 


von ihr zu Erinnerungszwecken mitgeschnittene Chat für For- 
schungszwecke verwendet werden darf. 


3.2 Wesentliche Erkenntnisse und Empfehlungen aus 
datenschutzrechtlicher Sicht 


3.2.1 Personenbezogene Daten 


Gegenstandsklärung: 

Datenschutzrechtliche Fragestellungen sind grundsätzlich zu beachten, sofern 
die Korpora personenbezogene Daten enthalten (§ 1 Abs. 1 in Verbindung mit 
Abs. 2 Bundesdatenschutzgesetz (BDSG)). Personenbezogene Daten sind gemäß 
§ 3 Abs. 1 BDSG „Einzelangaben über persönliche oder sachliche Verhältnisse 
einer bestimmten oder bestimmbaren natürlichen Person (Betroffener)“. Als 
persönliche Verhältnisse in diesem Sinne sind Angaben über Betroffene selbst, 
ihre Identifizierung und Charakterisierung anzusehen (z. B. Name, Anschrift, 
Familienstand, Geburtsdatum, Staatsangehörigkeit, Beruf, Erscheinungsbild, 
Eigenschaften, Gesundheitszustand). Auch Überzeugungen, Werturteile und 
biometrische Daten wie Fotografien, Fingerabdrücke sowie die Sprechweise 
zählen dazu. 


Einschätzung der Ressource: 

Nach Ansicht der Gutachter ist eine Personenbeziehbarkeit (i.e. Bestimmbarkeit 
im Sinne der o.g. Norm) nach dem strengen Datenschutzverständnis erst dann 
nicht mehr gegeben, wenn die Herstellung des Personenbezugs einen klar un- 
verhältnismäßigen Aufwand erfordern würde, von dem nicht zu erwarten ist, 
dass er getrieben würde. 

Soweit die Daten im Korpus auf Veranstaltungen oder Angebote der Auf- 
traggeberinnen selbst zurückgehen (wie z.B. das Subkorpus 1102000 in den 
Beispiele in Abschnitt 3.1), dürfte es mit einem gewissen Aufwand möglich sein, 
den einzelnen Chat-Beiträgen die seinerzeit tatsächlich handelnden Personen 
(z.B. an einem Seminar teilnehmende Studenten) nachträglich zuzuordnen. 

Enthalten Chat-Beiträge Einzelangaben über Personen (z.B. über das Alter, 
die Hobbies, das Aussehen, die Kinder und die täglichen Routinen des Nutzers 
in Chats), ist von Personenbeziehbarkeit i. S. d. BDSG auszugehen. Auch ein 
individueller Schreibstil (z.B. die Verwendung von Zahlen anstelle von Buch- 
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staben, sog. ‚Leetspeak’) kann prinzipiell mit Kommunikationsbeiträgen außer- 
halb des Korpus verglichen werden und damit eine Zuordnung zu einer be- 
stimmten Person erlauben. Anders ist dieses Risiko aus stilometrischer Sicht zu 
bewerten: Aufgrund der Kürze von Chat-Nachrichten dürfte eine mögliche Iden- 
tifikation über den spezifischen Sprachstil ausgeschlossen sein. 

Insgesamt beinhaltet der Datenbestand nach Auffassung der Gutachter we- 
nige systematische Anhaltspunkte für personenbeziehbare Daten. Im Rahmen 
der Stichprobe konnte kein Fall gefunden werden, in dem es durch Recherchen 
möglich gewesen wäre, einen Personenbezug herzustellen. Restrisiken beste- 
hen hinsichtlich einer Identifikation im Nahfeld der Person aufgrund unerkann- 
ten Zusatzwissens, das eine Zuordnung der Daten ermöglicht. 


Empfehlung zur Behandlung der Korpusdaten: 
Bei einem Großteil der Korpora wurden bisher keine Standardmaßnahmen (z.B. 
Randomisierung von Hostnamen; Ersetzung der Nicknames, Ortsnamen, Exper- 
tennamen; Anonymisierung, Entfernung oder Permutierung der Zeitstempel) 
durchgeführt. Dies sollte nach Einschätzung der Gutachter dringend korrigiert 
werden. Bei Durchführung der Maßnahmen sei zu berücksichtigen, dass für 
diejenigen, die Zugriff auf die Originalquellen haben (sofern diese noch existie- 
ren), die Möglichkeit der Personenbeziehbarkeit fortbesteht. Des Weiteren kön- 
ne die Durchführung von Standardmaßnahmen zu einer großen Veränderung 
und in der Folge zu einem Wertverlust der Korpora führen. 

Zur Minimierung rechtlicher und ethischer Risiken (insbesondere auch der 
Gefahr des Reputationsverlustes von CLARIN-D) wird angeraten, ein hohes 
Datenschutzniveau anzustreben. 


3.2.2 Verantwortliche Stelle und anwendbares Recht 


Für die Frage, welche Rechtsgrundlagen für die Datenverarbeitung zur Anwen- 
dung kommen, ist von zentraler Bedeutung, welche Institution als datenverar- 
beitende und damit verantwortliche Stelle fungiert. Datenverarbeitung ist ein 
Rechtsbegriff aus § 3 BDSG und erfasst das Speichern, Verändern, Ubermitteln, 
Sperren und Löschen personenbezogener Daten. Sofern das Dachprojekt CLA- 
RIN die Verantwortung für die Datenverarbeitung übernimmt, dürften für CLA- 
RIN als europäische Forschungsinfrastruktur (ERIC) mit Sitz in Utrecht die nie- 
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derländischen Datenschutzregelungen anwendbar sein.” Daneben gelten die 
deutschen Regelungen, sofern man CLARIN-D als Niederlassung von CLARIN im 
Sinne von Art. 4 Abs. 1 der EU-Datenschutzrichtlinie (95/46/EC) wertet. 

Das Hosting des Korpus soll durch das Institut für Deutsche Sprache (IDS) 
und die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) durch- 
geführt werden. Als Stiftung des bürgerlichen Rechts ist das IDS nach Einschät- 
zung der Gutachter trotz teilweiser Beteiligung des Bundes zwar keine 6ffentli- 
che Stelle im Sinne von § 1 Abs. 2 Nr. 1 BDSG, sondern als nicht-öffentliche Stelle 
zu qualifizieren; das BDSG bleibt trotzdem anwendbar (vgl. § 1 Abs. 2 Nr. 3 
BDSG). Fiir die BBAW als 6ffentliche Landeseinrichtung des Landes Berlin” gilt 
hingegen das Berliner Landesdatenschutzgesetz (LDSG Berlin). Auch könnte 
CLARIN-D als Konsortium als verantwortliche Stelle des Privatrechts agieren; in 
diesem Fall fänden wiederum die entsprechenden Regelungen des BDSG für 
nicht-öffentliche Stellen Anwendung. 

Für die weitere Beurteilung der rechtlichen Bedingungen unterstellen die 
Gutachter, dass entweder das IDS oder CLARIN-D (im Folgenden wird vereinfa- 
chend nur CLARIN-D genannt) die für die Datenverarbeitung verantwortliche 
Stelle ist. Das Konsortium hat hierauf durch die Konzipierung der Datenverar- 
beitung und durch interne Verteilung von Verantwortlichkeiten einen gestal- 
tenden Einfluss, mit der dieses Ergebnis erzielt werden kann." 

Spezialgesetzliche Regelungen (z.B. des Telemediengesetzes) werden als 
nicht einschlägig erachtet: Zwar erfolgen im Rahmen des Projekts Erhebungen 
von personenbezogenen Daten im Rahmen eines Telemediendienstes; aller- 
dings beziehen sich diese auf die Nutzer der Plattform, nicht auf die Datenbe- 
stände der Korpora, die hier Gegenstand der Untersuchung waren. 


9 Beschluss der Kommission vom 29. Februar 2012 über die Einrichtung der gemeinsamen 
Infrastruktur für Sprachressourcen und -technologien als Konsortium für eine europäische 
Forschungsinfrastruktur (CLARIN ERIC) 

10 Vgl. § 1 Abs. 2 Nr. 2iVm. Art. 1 Abs. 3 des Staatsvertrages über die Berlin-Brandenburgische 
Akademie der Wissenschaften. 

11 Ein Hosting durch die BBAW oder auch - im Fall CLARIN-D als verantwortliche Stelle — 
durch das IDS kann dann im Rahmen einer Auftragsdatenverarbeitung nach § 11 BDSG durch- 
geführt werden, für die dort weitere Zulässigkeitsvoraussetzungen normiert sind, die aber für 
die Frage der grundsätzlichen Rechtmäßigkeit der Erhebung und Verarbeitung hier außer 
Betracht bleiben können. 
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3.2.3 Rechtmäßigkeit der Datenverarbeitung 


Das BDSG verlangt prinzipiell für jeder Verarbeitung personenbezogener Daten 
eine Rechtsgrundlage, sofern für die konkrete Datenverarbeitung eine solche 
nicht besteht, ist die Verarbeitung rechtswidrig.'? In Betracht käme eine für die 
untersuchten Fälle zum einen die Einwilligung nach § 4a BDSG oder der Er- 
laubnistatbestand des § 29 BDSG.'? Diese beiden Rechtsgrundlagen werden 
nachfolgend näher ausgeführt. 


3.2.3.1 Einwilligung nach $ 4a BDSG 

Sofern und soweit ein Eingriff in die datenschutzrechtlich gesicherten Bereiche 

nicht durch Anonymisierung ausgeschlossen werden kann, braucht es eine 

Rechtsgrundlage. Eine solche könnte in einer Einwilligung bestehen. 

a) Mehrere Beteiligte: Bei bi- und multilateraler Kommunikation, die in ge- 
schlossenen Benutzergruppen stattgefunden hat, gilt zunächst zu beachten, 
dass die Einwilligung aller Beteiligter vorliegen muss. Außerdem ist zu be- 
rücksichtigen, dass eine Einwilligung der unmittelbar Teilnehmenden die 
Daten, die diese Chattenden über Dritte verbreiten, regelmäßig nicht um- 
fasst. Die Herstellung eines Personenbezugs bei diesen Daten würde aller- 
dings einen äußerst hohen Aufwand erfordern, sofern Stichproben diesbe- 
züglich repräsentativ waren. Diesbezüglich wird also unterstellt, dass keine 
Personenbeziehbarkeit im datenschutzrechtlichen Sinne vorliegt. 

b) Schriftlichkeit: Gemäß § 4a Abs. 1 Satz 3 BDSG ist grundsätzlich für jeden 
weiteren Nutzungsschritt in Bezug auf die Daten eine schriftliche Einwilli- 
gung (eigenhändig unterzeichnet, klar umgrenzt) erforderlich, also insbe- 
sondere auch zur Veröffentlichung in einem anderen Kontext. 

c) In Ausnahmefällen kann eine andere Form angemessen sein (vgl. $ 4a Abs. 
1 Satz 3 BDSG). Grundsätzlich wäre nach Auffassung der Gutachter eine 


12 Manchmal in begrifflich fragwürdiger Weise auch in der datenschutzrechtlichen Fachlitera- 
tur als „Verbot mit Erlaubnisvorbehalt“ beschrieben. Tatsächlich handelt es sich um eine 
klassische rechtliche Regel-Ausnahme-Technik, wie sie in vielen Rechtsbereichen vorzufinden 
ist. Der Begriff des „Verbots mit Erlaubnisvorbehalt“ ist ein Terminus technicus des Verwal- 
tungsrechts und unterschiedet verschiedene Formen von Genehmigungstatbeständen. Er dient 
der Abgrenzung des präventiven Verbots mit Erlaubnisvorbehalt vom repressiven Verbot mit 
Befreiungsvorbehalt.. 

13 Entsprechend der oben dargestellten Empfehlung, die Verarbeitung in Verantwortung 
durch das IDS oder CLARIN-D selbst durchzuführen, konzentriert sich die Prüfung auf die 
Tatbestände der §§ 27ff. BDSG und lässt solche für den öffentlichen Bereich außer Betracht. 
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konkludente Einwilligung in Form schlüssigen Verhaltens denkbar, da 
Teilnehmer in Chats, Newsgroups, Foren und anderen netzbasierten Kom- 
munikationsformen üblicherweise deren Funktionsweise und die damit 
verbundene öffentliche Sichtbarkeit der Beiträge kennen; eine Verwendung 
in anderem Kontext wäre mangels Vorhersehbarkeit allerdings auch von 


einer konkludenten Einwilligung nicht erfasst. 


d) Minderjährigenschutz: Für eine wirksame Einwilligung Minderjähriger ist 
deren jeweilige Einsichtsfähigkeit abhängig von Alter, geistiger Reife und 
Verwendungszusammenhang maßgeblich. Eine Orientierung bieten die Al- 


tersgrenzen der 88 2, 104 ff. BGB. 


e) Da Alter und geistige Reife der im Korpus erfassten Chatter mitunter nicht 
zweifelsfrei feststellbar sind, verbleibt auch bei vorliegenden Einwilligun- 
gen ein erhebliches Restrisiko. Dieses erhöht sich zusätzlich, wenn davon 
ausgegangen wird, dass neben einer wirksamen Einwilligung eines Minder- 
jährigen auch die Einwilligung aller Erziehungsberechtigten vorliegen muss 


(sog. „Theorie von der Doppelzuständigkeit“). 


f) Freie Widerruflichkeit: Es gilt zu beachten, dass datenschutzrechtliche Ein- 
willigungen für die Zukunft frei widerruflich sind, was in Landesdaten- 
schutzgesetzen teils ausdrücklich geregelt ist, nach herrschender Meinung 
aber verfassungsrechtlich begründet auch für das BDSG gilt“, in dem die 
Widerruflichkeit etwa in Hinblick auf spezielle Verwendungsprivilegien in § 
28 und darüber hinaus mit weiteren Anforderungen in § 35 Abs. 5 ausdrück- 


lich genannt wird. 


g) Datenübermittlung im Ausland: Zum Zeitpunkt der Begutachtung konnte 
nicht beurteilt werden, inwieweit in Zukunft aus dem Ausland auf die Kor- 
pora zugegriffen werden soll. In einem solchen Fall wären die besonderen 


Zustimmungs- und Einwilligungsregelungen des § 4b BDSG zu beachten. 


Fazit zur Einwilligung nach $ 4a BDSG: Eine allein auf Einwilligungen der Be- 
troffenen gestützte Datenverarbeitung ist nach Ansicht der Gutachter aufgrund 


erheblicher rechtlicher und tatsächlicher Unsicherheiten nicht empfehlenswert. 


3.2.3.2 Erlaubnistatbestand des § 29 BDSG 


Ein Erlaubnistatbestand ist eine gesetzliche Regelung, die ein an sich verbote- 
nes Handeln im Einzelfall ausnahmsweise gestattet. Da CLARIN-D die Korpora 


14 Vgl. T. Herbst, MedR (2009) 27, S. 149 (150) m. w. N. 
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Dritten zur Verfügung stellen will, ist Gegenstand der Prüfung nicht die eigene 

Forschungstatigkeit von CLARIN-D®, sondern die Frage der Zulässigkeit und des 

Umfangs der Übermittlung der Korpora. Dass CLARIN-D als Forschungsinfra- 

struktur einen unterstützenden Beitrag zur Forschung anderer leisten will, än- 

dert nichts daran, dass der Schwerpunkt im Ubermittlungszweck liegt." 

Entscheidend ist damit, ob die Voraussetzungen des § 29 BDSG (Geschäfts- 
mäßige Datenerhebung und -speicherung zum Zwecke der Übermittlung) erfüllt 
sind. 

Für die Tätigkeit von CLARIN-D ist von Geschäftsmäßigkeit auszugehen. Ge- 
schäftsmäßigkeit ist dadurch definiert, dass die Tätigkeit auf eine gewisse Dau- 
er angelegt und auf Wiederholung gerichtet ist, was bei CLARIN-D der Fall ist. 
Für die weitere Beurteilung der Rechtmäßigkeit sind verschiedene Phasen der 
Verarbeitung zu unterscheiden: Die erste Erhebung durch eine andere Stelle, 
der Datenzufluss, die Verarbeitung im engeren Sinne, sowie die anschließende 
Übermittlung an Dritte: 

a) Ersterhebung: Für eine Rechtswidrigkeit der Ersterhebungen der Daten 
beim Betroffenen bestehen nach Auffassung der Gutachter keine Anhalts- 
punkte. 

b) Datenzufluss: Datenzufluss bezeichnet den Vorgang, während dessen die 
Daten nach ihrer Erhebung zum Datenverarbeiter (hier CLARIN-D) gelan- 
gen. Voraussetzung für die Rechtmäßigkeit der Erhebung durch CLARIN-D 
ist zunächst, dass kein schutzwürdiges Interesse der Betroffenen an einem 
Ausschluss der Datenverarbeitung besteht, § 29 Abs. 1 Nr. 1 BDSG, oder dass 
sie aus einer „allgemein zugänglichen Quelle“ stammen und entgegen ste- 
hende berechtigte Interessen der Betroffenen nicht offensichtlich sind, § 29 
Abs. 1 Nr. 2 BDSG. 

Für problematisch hielten die Gutachter diesbezüglich das Teilkorpus 

1201000, das Mitschnitte eines psychosozialen Beratungsangebots enthält, 

in denen Ratsuchende u.a. in Einzelchats psychische Belastungen, Störun- 

gen und Suchterkrankungen mit Beratern thematisieren. Entsprechend der 


15 In einem solchen Fall müsste zunächst eine Prüfung des § 28 BDSG erfolgen. 

16 § 28 BDSG (Datenerhebung und -speicherung für eigene Geschäftszwecke) scheidet aus 
diesem Grund als Rechtsgrundlage aus. Ähnliches gilt hinsichtlich der Verweisung des § 29 
Abs. 5 BDSG auf § 28 Abs. 6 BDSG, dort insbesondere Nr. 4. Hiernach wäre nur eine Verarbei- 
tung zu einem konkreten Forschungsvorhaben gedeckt, was nach angezeigter enger Ausle- 
gung nicht fiir ein Infrastrukturprojekt wie CLARIN-D gelten kann. Das Gleiche gilt fiir die 
Sondervorschrift des § 40 BDSG (Verarbeitung und Nutzung personenbezogener Daten fiir 
Forschungszwecke) zur Veröffentlichung von Daten. 

17 Ehmann in Simitis, Kommentar zum BDSG, 8. Auflage 2014, § 29. Rn. 121. 
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Sensitivität dieser Gegenstände bestehe ein hohes schutzwürdiges Interesse 
der Betroffenen, weshalb anzunehmen ist, dass bereits die Erfassung des 
Korpus durch CLARIN-D nicht datenschutzrechtskonform wäre. Zwar mag 
aus der reinen Erhebung durch CLARIN-D noch kein massiver Eingriff er- 
wachsen, wohl aber wäre dies - mangels zugesicherter Anonymisierung - 
im Falle der Weitergabe der Bestände gegeben. Sofern aber eine Weitergabe 
unzulässig ist, entfällt auch der Zweck der Erhebung, was auch diese unzu- 
lässig macht. Allenfalls kann die Erhebung noch auf den Zweck gestützt 
werden, dass man eine Eignung für die spätere Übermittlung prüfen wolle. 
Spätestens mit der abschlägigen Prüfung entfällt aber die Erforderlichkeit 
der weiteren Speicherung. Aus diesem Grund empfehlen die Gutachter 
dringend, das Teilkorpus 1201000 aus der in CLARIN-D zu integrierenden 
Version des Korpus zu entfernen sowie alle Kopien zu löschen. 

Für alle anderen Teilkorpora ist für die Gutachter (nach Stichprobenprü- 
fung) ein überwiegendes Interesse der Betroffenen, das einer Erhebung 
durch CLARIN-D entgegenstünde, nicht erkennbar. 

c) Verarbeitung im engeren Sinne: Die im Projekt vorgesehenen Aufbereitun- 
gen der Korpora (Konvertierungen, Einbringen von Annotationen etc.) stel- 
len keine Datenverarbeitungen dar, die die geschützten Interessen der Be- 
troffenen in besonderer Weise tangieren. Derartige Verarbeitungen treffen 
auf keine datenschutzrechtlichen Bedenken. 

d) Übermittlung an Dritte: Für die Integration der Korpora kommt es damit 
darauf an, ob die Übermittlungszwecke gegenüber den berechtigten Inte- 
ressen der (potentiell) Betroffenen überwiegen bzw. offensichtlich überwie- 
gen. Im Rahmen der CLARIN-D-Forschungsinfrastruktur werden Datenbe- 
stände in verschiedenen Modellen angeboten, die nach dem Grad der 
Zugänglichkeit der ursprünglichen Datenquellen zu unterscheiden sind: 

— Korpora aus allgemein verfügbaren Quellen:" Für diese ist im Idealfall 
eine öffentliche Verfügbarmachung angestrebt (CLARIN-Endnutzer- 
Lizenz vom Typ PUB), die u.a. keinen spezifischen datenschutzrechtli- 


18 Teilweise umstritten ist dabei die hier durchaus relevante Frage, ob auch eine Kommunika- 
tionsumgebung, die lediglich einer Anmeldung bedarf, die aber jedermann zugänglich ist, 
noch als allgemein verfügbare Quelle zu qualifizieren ist. Schon zur Vermeidung von rechtli- 
chen Risiken, sei hier empfohlen, solche Inhalte nicht als Inhalte aus allgemein verfügbaren 
Quellen zu betrachten. Sachlich spricht hierfür im Übrigen auch, dass diese Inhalte regelmäßig 
nicht durch Suchmaschinen indiziert werden können und sich damit tatsächlich deutlich von 
den üblichen öffentlich zugänglichen Inhalten unterscheiden. 
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chen Beschränkungen unterliegt.” Im Falle einer Übermittlung unter 
dieser Lizenz würde es sich um eine Übermittlung zum Zwecke der all- 
gemeinen Zugänglichmachung handeln. Rechtlich würde CLARIN-D 
hier eine einer Suchmaschine ähnliche Funktion übernehmen. Auf Ba- 
sis der Stichprobenprüfung gehen die Gutachter davon aus, dass hin- 
sichtlich derjenigen Korpora, die aus allgemein zugänglichen Quellen 
stammen, die geschützten Interessen der Betroffenen jedenfalls nicht 
offensichtlich überwiegen. Voraussetzung hierfür wäre allerdings die 
Durchführung von Standardmaßnahmen (vgl. 3.2.1). Unter dieser Be- 
dingung können diese Korpora öffentlich zugänglich gemacht werden. 

— Korpora aus geschlossenen Nutzergruppen: Ausweislich § 29 Abs. 1 Nr. 1 

und Abs. 2 Nr. 2 BDSG darf bei dieser Art der Korpora kein Grund zur 
Annahme bestehen, dass der Betroffene ein schutzwiirdiges Interesse 
am Ausschluss der Verarbeitung und Ubermittlung hat. Ein solches 
könnte sich daraus ergeben, dass sich der Nutzer ganz bewusst nicht 
frei für jedermann einsehbar, sondern in einer geschlossenen Nutzer- 
gruppe geäußert hat. Dabei ist auch zu berücksichtigen, dass bei einer 
öffentlichen Zugänglichmachung nicht auszuschließen ist, dass die Da- 
tenbestände durch Dritte weiter indiziert werden und nach einiger Zeit 
auch über Suchmaschinen gefunden werden können. So wäre schließ- 
lich denkbar, dass eine in einem geschlossenen Chat gemachte Äuße- 
rung - möglicherweise noch dazu weitgehend zusammenhangslos - in 
einer Suchanfrage zu einer Person (einem gewählten Pseudonym, einer 
sprachlichen Eigenheit) auftaucht. Eine freie Veröffentlichung dieser 
Teilkorpora außerhalb des wissenschaftlichen Kontexts scheint daher 
datenschutzrechtlich nicht angeraten. 
Sofern die Verfügbarmachung des Korpus auf Forschungszwecke ein- 
geschränkt wird, stehen einer Übermittlung keine schutzwürdigen In- 
teressen der Betroffenen entgegen, weshalb eine Zugänglichmachung 
datenschutzrechtlich möglich erscheint. 

— Abwägung: Die frühere Rechtsprechung des BGH verlangte eine Abwä- 
gung zwischen den schutzwürdigen Belangen des Persönlichkeits- 
rechts des Betroffenen gegen die Interessen der speichernden Stelle. 
Nach Änderung des Wortlauts des BDSG verlangen einige weiterhin 


19 Vgl. dazu https://corpora.uni-hamburg.de/drupal/de/korpusanfragen-lizenzen, allerdings 
gelten naturgemäß auch für diese Datenbestände und die Datenverarbeitung durch die Emp- 
fänger der Bestände datenschutzrechtliche Anforderungen, sofern sie diesen gesetzlich unter- 
worfen sind. 
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diese am Verhältnismäßigkeitsgrundsatz ausgerichtete Abwägung.” 


An den vorstehenden Ergebnissen ändert sich nach Auffassung der 
Gutachter allerdings auch dann nichts, wenn man dem 8 29 Abs. 1 Nr. 1 
und Abs. 2 Nr. 1 BDSG ein Abwägungselement hinzufügen wollte. An- 
ders als für bereits allgemein zugängliche Daten könne gerade an dem 
in geschlossenen Nutzergruppen formulierten Beitrag kein pauschales 
allgemeines Informationsinteresse aus Art. 5 Abs. 1 Grundgesetz (GG) 
hergeleitet werden, welches das Recht am eigenen Wort überwiegen 
könnte. Die auch die Informationsfreiheit umfassende Meinungsfrei- 
heit schützt ausweislich ihres Wortlautes nur die Information aus all- 
gemein zugänglichen, nicht die aus geschlossenen Quellen. Allerdings 
könne bei einer Abwägung zwischen dem Recht am eigenen Wort und 
der Forschungsfreiheit aus Art. 5 Abs. 3 GG die Letztere als überwie- 
gend unterstellt werden, so dass auch nach dieser Auffassung das glei- 
che Ergebnis erzielt wird. 


Des Weiteren verweisen die Gutachter auf $ 28 Abs. 1 Satz 2 BDSG als eigene 
Zulässigkeitsvoraussetzung. Demnach seien bei der Erhebung der Daten die 
konkreten Zwecke der Verarbeitung festzulegen. Dabei reiche eine reine Festle- 
gung auf den „Zweck der Übermittlung“ nicht aus. Einige Stimmen in der Lite- 
ratur fordern für die Privilegierung zu Forschungszwecken gemäß § 28 Abs. 3 
Nr. 4 BDSG eine konkrete Bestimmung des Forschungsvorhabens”, andere se- 
hen bei klarer Definition von Ziel, Aufbau und Verlauf des Vorhabens auch das 
Anlegen von langfristigen Forschungsdatenbanken zur Entwicklung wissen- 
schaftlicher Infrastruktur” erfasst. Sofern man - der Rechtsprechung folgend - 
für § 29 Abs. 1 Nr. 2 BDSG eine Zweckkonkretisierung im Sinne des Ansinnens, 
„der Öffentlichkeit die Nutzung des Internets zu erleichtern, wenn nicht gar erst 
zu ermöglichen“ als hinreichende Anforderung gelten lassen wolle, müsse das 
erst recht gelten, wenn Wissenschaftlern die Nutzung von Forschungsdaten 
erleichtert oder gar erst ermöglicht werden solle. Dies ergibt sich nach Ansicht 
der Gutachter systematisch nicht zuletzt daraus, dass Forschungszwecke im 
Datenschutzrecht regelmäßig Privilegierungen genießen, aber auch - jedenfalls 
wertend - aus der grundrechtlichen Forschungsfreiheit des Art. 5 Abs. 3 GG. 
Somit spräche vieles dafür, dass § 29 BDSG nicht deshalb als mögliche Rechts- 
grundlage für die Verarbeitung der Schriftkorpora durch CLARIN-D auszu- 


20 Vgl. zum Streitstand: Ehmann in Simitis, § 29 Rn. 453ff. 
21 AaO, § 28 Rn. 203. 
22 Dammann in Simitis, § 14 Rn. 91. 
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schließen sei, weil die konkreten Forschungszwecke nicht hinreichend be- 
stimmt seien. Allerdings wird ausdrücklich darauf hingewiesen, dass andere 
Auffassungen zu dieser Problematik vertretbar sind, weshalb eine Verfügbar- 
machung zu Forschungszwecken zwar vertretbar erscheint, aber nicht den Weg 
des geringsten rechtlichen Risikos darstellt. 


Empfehlung zur Behandlung der Korpusdaten: 

Im Rahmen von CLARIN-D kann nach Einschätzung der Gutachter das Risiko 

reduziert werden, indem 

1) die öffentliche Verbreitung auf diejenigen Teilkorpora beschränkt wird, die 
unter § 29 Abs. 1 Nr. 2 BDSG fallen, d. h. die insbesondere Daten aus allge- 
mein zugänglichen Quellen enthalten; 

2) alle Elemente, die nicht nur unerhebliche Identifizierungsrisiken bergen, im 
Rahmen der bereits empfohlenen Anonymisierung unkenntlich gemacht 
werden. Als mögliche Verfahren werden empfohlen: Variablenunterdrü- 
ckung, Objektunterdrückung, Informationsreduktion, Zufalls-vertauschun- 
gen und Zufallsüberlagerungen. Eine für jeden Einzelfall verlässliche auto- 
matische Anonymisierung von Freitexten erscheint dagegen technisch nicht 
möglich, da diese mit maschinellen Lernverfahren arbeiten, die bei der 
Übertragung der Muster auf andere Chats versagen. 


Die Anwendung der Rechtsgrundlage des 8 29 BDSG erfordere weiterhin: 

— eine Glaubhaftmachung des berechtigten Interesses, § 29 Abs. 2 Nr. 1 BDSG; 

— eine Aufzeichnung der Ubermittlungen, § 29 Abs. 4 BDSG; 

— eine Meldung der Verarbeitung bei der zuständigen Aufsichtsbehörde, § 4d 
Abs. 1 BDSG. 


Bei denjenigen Teilkorpora, die im Sinne von § 19 UrhG öffentlich zugänglich 
gemacht werden, sei laut Gutachten das berechtigte Interesse als allgemeines 
Informationsinteresse stets indiziert, eine Überprüfung und eine Protokollie- 
rung der Zugriffe könne in diesen Fällen entfallen. Aus Gründen der Datenspar- 
samkeit erscheine es sogar geboten, auf eine solche Protokollierung zu verzich- 
ten.” 


23 Das Prinzip der Datensparsamkeit besagt, dass von einem Betroffenen nur insoweit Daten 
erhoben und verarbeitet werden diirfen, als unbedingt notwendig. 
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3.3 Wesentliche Erkenntnisse und Empfehlungen aus 
persönlichkeitsrechtlicher Sicht 


Das Allgemeine Persönlichkeitsrecht (APR; Art. 2 Abs. 1in Verbindung mit Art. 1 
Abs. 1 GG) jedes Menschen ist insbesondere ein Verfügungsrecht über die Dar- 
stellung der Person in der Öffentlichkeit und bildet die Basis für den Schutz der 
Sozialsphäre, Privatsphäre und Intimsphare.” 

Soweit allerdings Datenschutznormen eingreifen (siehe oben), gehen diese 
als speziellere Regelungen der unmittelbaren Anwendung des APR vor. 

Das APR ist folglich nur als Auffangregelung anzusehen. Ist es anwendbar, 
muss eine umfassende Interessenabwägung zwischen der Intensität des Ein- 
griffs in den Schutzbereich des APR und dem öffentlichen Interesse an der Zu- 
ganglichmachung der Information (Art. 5 GG) vorgenommen werden: So sei 
nach Auffassung der Gutachter bei Beiträgen in öffentlichen Foren eine relativ 
geringe Beeinträchtigung anzunehmen, insoweit sich die Äußernden freiwillig 
ihres Persönlichkeitsschutzes begeben hätten. 

Eine besondere Ausprägung des APR ist der Schutz der persönlichen Ehre: 
Diesbezüglich merken die Gutachter an, dass allein auf Beleidigung und Her- 
abwürdigung erkennbarer Dritter abzielende Beiträge aus den Korpora gefiltert 
werden müssten, da ansonsten eine Verbreiterhaftung drohe. Das bedeutet, 
dass jeder Rückbezug auf eine bestimmbare Person ausgeschlossen werden 
muss, z.B. durch eine Anonymisierung. 

Eine weitere Ausprägung des APR, die insbesondere bei Äußerungen in ge- 
schlossenen Nutzergruppen Bedeutung gewinnt, sei das Recht am eigenen 
Wort: Geschützt ist hierdurch die Selbstbestimmung über die eigene Darstel- 
lung der Person in der Kommunikation mit anderen; auch die Befugnis zur Be- 
stimmung des Empfängerkreises des Kommunikationsinhalts ist erfasst. Jedoch 
trete der Schutz des Rechts am eigenen Wort auch subsidiär hinter die Daten- 
schutzregelungen zurück, weshalb für eine Anwendung lediglich der Bereich 
der allgemeinen Rede verbleibe.” Ein Eingriff in diesen Schutzbereich läge aller- 
dings nur dann vor, wenn diese Rede realistischerweise einer bestimmten wirk- 
lichen Person zugeordnet werden könne. 


24 Vgl. die infolge der Rechtsprechung des BVerfG entwickelte Sphärentheorie (Sozialsphäre, 
Privatsphäre und Intimsphäre). 

25 Der Bereich der allgemeinen Rede umfasst im juristischen Sinne alles Gesagte bzw. Ge- 
schriebene mit Ausnahme von Angaben im Sinne von Informationen, Tatsachenbehauptungen 
oder Werturteilen. 
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Mangels Bild-, Video- und Tondateien in den Korpora finden 88 22, 23 des 
Gesetzes betreffend das Urheberrecht an Werken der bildenden Künste und der 
Photographie (KUG) und das - aus dem APR abgeleitete — Recht an der eigenen 
Stimme vorliegend keine Anwendung. Auch eine Verletzung des Namensrechts 
aus § 12 BGB scheidet nach Ansicht der Gutachter mangels Namensbestreitung 
oder Namensanmaßung aus, da die Verwendung von Nicknames gerade keinen 
Anspruch des Verwenders impliziere, tatsächlich so zu heißen. 


3.4 Wesentliche Erkenntnisse und Empfehlungen aus 
urheber- bzw. leistungsschutzrechtlicher Sicht 


3.4.1 Urheberrecht: Chat-Beiträge als Sprachwerke 


Nach dem Dafürhalten der Gutachter sind allenfalls einige wenige Textbeiträge 
innerhalb der Teilkorpora der Ausgangsressource gemäß § 2 Abs. 1 Urheber- 
rechtsgesetz (UrhG) urheberrechtlich schutzfähig. Trotz der geringen Anforde- 
rungen gemäß dem Maßstab der sog. „kleinen Münze“ als persönlicher geisti- 
ger Schöpfung im Sinne des § 2 Abs. 2 UrhG scheiden die meisten Chat-Beiträge 
aufgrund ihrer Kürze und/oder eines Mangels an Individualität aus. 

Sollte ausnahmsweise Urheberrechtsschutz bestehen, würden durch das 
Hosting der Korpora v.a. das Vervielfältigungsrecht (8 16 UrhG), das Recht der 
öffentlichen Zugänglichmachung (§ 19a UrhG) und das Veröffentlichungsrecht 
(§ 12 UrhG) tangiert. Folglich bedürfe es dann eines wirksamen Nutzungsrechts 
oder einer eingreifenden Urheberrechtsschranke”. Sofern Urheberrechtsschutz 
an den Beiträgen besteht (siehe oben), wäre die Speicherung auf den CLARIN-D- 
Servern als eine Vervielfältigung (§ 16 UrhG), die nur mit Erlaubnis des Urhebers 
zulässig ist. Die Schrankenregelung des $ 44a UrhG zugunsten technisch be- 
dingter Zwischenspeicherungen greife vorliegend nicht ein. 

a) Im Fall geschlossener Interaktionen (private Chatrooms) könne mit der 

Einbindung in die CLARIN-D-Forschungsstruktur eine erstmalige 6ffentli- 

che Wiedergabe im Sinne des $ 15 Abs. 2 UrhG vorliegen. Öffentlichkeit liegt 


26 Um Urheberrechtsschutz genießen zu dürfen, muss es ein Werk nicht zwangsläufig heraus- 
ragend sein. Auch durchschnittliche Werke sind dem Schutz zugänglich, sofern sie die erfor- 
derliche Individualität aufweisen. 

27 Grundsätzlich darf ein urheberrechtlich geschütztes Werk nur mit Zustimmung des Urhe- 
bers genutzt werden. Urheberrechtsschranken erlauben hingegen unter besonderen Umstän- 
den von Gesetzes wegen eine Nutzung des Werkes, um die Interessen der Allgemeinheit bzw. 
bestimmter Nutzergruppen (z. B. der Forschung) in angemessenen Ausgleich zu bringen. 
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gemäß § 15 Abs. 3 UrhG immer dann vor, wenn diejenigen Personen, denen 
ein Werk wahrnehmbar gemacht wird, nicht untereinander oder mit demje- 
nigen, der die Wiedergabe vornimmt, „persönlich verbunden“ sind. Die 
über CLARIN-D auf Korpora zugreifenden Personen seien — auch im Falle 
strikter Zugangskontrollen - keineswegs in der vorgenannten Weise mitei- 
nander verbunden. 

Die Textinhalte aus geschlossenen, etwa bilateralen, Chats würden somit 
durch ein Einstellen bei CLARIN-D im rechtlichen Sinne erstmals öffentlich 
wiedergegeben, was — soweit urheberrechtlicher Schutz besteht (siehe 
oben) — neben dem Nutzungsrecht nach § 19a UrhG das Veröffentlichungs- 
recht des Urhebers aus § 12 Abs. 1 UrhG berührte. Dies gälte unabhängig da- 
von, ob die jeweilige Urheberin bzw. der Urheber dank Anonymisierung 
nicht mit wirklichem Namen, etwa nur unter einem Pseudonym, erkennbar 
ist. Eine ohne Zustimmung erfolgten Entfernung des Namens könne sogar 
eine weitere, vertiefende Verletzung des Anerkennungsrechts des Urhebers 
aus § 13 UrhG darstellen. 

b) Bei zahlreichen Teilkorpora des Dortmunder Chat-Korpus liegen bzw. lagen 
lediglich mündliche Erlaubnisse vor. Im Streitfalle gäbe es zunächst ein er- 
hebliches Nachweisproblem (es wäre richterliche Überzeugung vom Vorlie- 
gen der Erlaubnis notwendig, $ 286 Zivilprozessordnung (ZPO)). Inwieweit 
das in concreto der Fall wäre, entzieht sich der Bewertung der Gutachter, da 
sie die beteiligten Personen und genauen Umstände nicht näher kennen. 
Fraglich sei ferner, wie weit die mündliche Rechteeinräumung reiche: Je- 
denfalls sei ein einfaches Nutzungsrecht zur Vervielfältigung (§ 16 UrhG) 
sowie zur öffentlichen Zugänglichmachung (§ 19a UrhG) eingeräumt wor- 
den. Dieses sei nicht auf ein bestimmtes Forschungsvorhaben und damit 
auch zeitlich und örtlich unbeschränkt. Allerdings beschränke sich der 
Nutzungszweck auf Sprachforschung und allgemeine Sprachrecherche. Ei- 
ne Unterlizenzierung sei nach Einschätzung der Gutachter nicht erlaubt. 

c) Die in der CLARIN-D-Infrastruktur gebotenen Möglichkeiten, Annotationen 
vorzunehmen und die Inhalte zu analysieren, verändern nach Ansicht der 
Gutachter die eigentlichen Interaktionen inhaltlich nicht. Daher liege inso- 
weit eine freie Benutzung im Sinne von § 24 Abs. 1 UrhG vor, die unabhän- 
gig von etwaigen Erlaubnissen urheberrechtlich zulässig sei. 

d) Bezüglich der Korpora, bei denen keine Erlaubnisse und damit keine Nut- 
zungsrechtseinräumungen der Beitragenden vorliegen, wäre ein Rückgriff 
auf die Schranken des Urheberrechts zu erwägen. Ein öffentliche Zugäng- 
lichmachung unter der Schranke des § 52a UrhG wäre lediglich denkbar, 
wenn die Zugriffsmöglichkeit auf einen bestimmt abgegrenzten Kreis von 
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Personen für deren eigene wissenschaftliche Forschung beschränkt würde, 
was allerdings erhebliche Auswirkungen auf das technische Design der 
CLARIN-D-Infrastruktur hätte. Die Schranke des 8 53 Abs. 2 Nr. 1 UrhG wie- 
derum sei auf die Sammlungen einzelner Wissenschaftler ausgerichtet und 
daher für den vorliegenden Fall ungeeignet. 


Empfehlung zur Behandlung der Korpusdaten: 

Angesichts des geringen Anteils potenziell schutzfähiger Inhalte, der ebenfalls 
geringen Wahrscheinlichkeit, dass deren Rechteinhaber wirklich materiell in 
Urheberinteressen berührt sind und ein rechtliches Vorgehen? auch realistisch 
erwägen würden, und der selbst dann eher geringen wirtschaftlichen Risiken, 
stellt sich nach Einschätzung der Gutachter der Umgang mit dem Urheberrecht 
der Chat-Teilnehmenden eher als eine Frage des öffentlichen Ansehens und des 
Vorbildcharakters der beteiligten Institutionen dar denn als eine juristische. 

Wenn sicher ausgeschlossen werden solle, dass eine urheberrechtsverlet- 
zende Integration in die CLARIN-D-Infrastruktur erfolgt, müssten die Textinhal- 
te vollständig - Zeile für Zeile - fachlich begutachtet werden -, und selbst dann 
könnten Anteile übrig bleiben, bei denen erneut nur eine Risikoabschätzung zu 
der Frage, wie ein Gericht den Sachverhalt im Streitfalle sehen könnte, möglich 
sei. 

Folgende Vorsichtsmaßnahmen könnten demgegenüber ein rechtliches Ri- 
siko zumindest zusätzlich verringern: Für längere (nicht dialogische) Passagen 
könnte die Möglichkeit des Downloads unterbunden werden oder bei Abfrage 
des Systems nur eine ausschnittsweise Wiedergabe der gefundenen Stellen 
erfolgen. Denkbar wäre auch ein reines Query-and-analysis-only (QAO), bei 
dem gar kein Einblick in die Daten gewährt wird; dies hätte allerdings höchst- 
wahrscheinlich eine gravierende Einschränkung der Forschungsarbeit zur Fol- 
ge. 


28 In Betracht käme ein strafrechtliches (§§ 106 ff. UrhG) sowie ein zivilrechtliches Vorgehen 
(88 97-105 UrhG). Selbst auf eine Strafanzeige hin wäre es extrem unwahrscheinlich, dass sich 
eine Staatsanwaltschaft in Deutschland dazu veranlasst sehen könnte, Forschungsinstitutio- 
nen wegen unberechtigter Zugänglichmachung von Forschungsmaterial zu verfolgen. Zivil- 
rechtlich wäre eine Abmahnung der beteiligten Institutionen denkbar: Aber selbst bei einem 
hoch angesetzten Gegenstandswert von 10.000 Euro längen die Gebühren gemäß Rechtsan- 
waltsvergütungsgesetz (RVG, 1,0-Gebühr nach Nr. 2300 des Vergütungsverzeichnisses) bei 
etwas über 500 €. Der zu addierende (verschuldensabhängige) Schadensersatz würde nominell 
ausfallen, da es keinen Lizenzmarkt für Chat-Äußerungen gibt, und wäre praktisch vernachläs- 
sigenswert. 
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3.4.2 Datenbankherstellerrecht (§§ 87ff. UrhG) 


Gemäß § 87b UrhG ist es ohne Zustimmung des Herstellers einer Datenbank 
grundsätzlich unzulässig, einen nach Art und Umfang wesentlichen Teil einer 
Datenbank oder die Datenbank als Ganze zu vervielfältigen, zu verbreiten oder 
öffentlich wiederzugeben. Grundvoraussetzung für einen solchen Anspruch 
wäre das Vorliegen einer Datenbank im Rechtssinne. Erforderlich ist hierfür im 
Sinne von § 87a UrhG eine Datensammlung, deren Elemente systematisch und 
methodisch angeordnet sind und mit Hilfe elektronischer Mittel einzeln zugäng- 
lich gemacht werden und für deren Beschaffung, Überprüfung und Darstellung 
eine wesentliche Investition erforderlich war bzw. ist. Ob Chats oder andere 
dialogische Kommunikationsumgebungen Datenbanken in diesem Sinne dar- 
stellen, wurde bisher höchstrichterlich noch nicht entschieden. Davon sei nach 
Ansicht der Gutachter aufgrund der einfachen Funktionsweise der automati- 
schen, chronologischen Anordnung der Konversationen mangels Leistung des 
Datenbankherstellers nicht auszugehen. Selbst wenn eine thematische Struktu- 
rierung existiere, erfolge diese durch die Chat-Teilnehmenden, nicht durch den 
Systembetreiber als Datenbankhersteller. 

Eine wesentliche Investition im Sinne von 88 87a ff. UrhG läge hingegen in 
der Entwicklung der für die Chats genutzten Software. Deren Rechteinhaber 
hätten nach Einschätzung der Gutachter jedoch voraussichtlich kein Interesse 
an einer Verfolgung einer Verletzung ihres Datenbankherstellerrechts - falls ein 
solches überhaupt bestehe. 

Anders zu bewerten sei die Problematik hingegen mit Blick auf die eigenen 
Datenbankherstellerrechte der Institutionen, die die Aufbereitung der Korpora 
initiiert und durchgeführt haben. Bezüglich des Dortmunder Chat-Korpus wäre 
dies vermutlich die TU Dortmund. Empfehlenswert sei hierfür — sofern die Kor- 
pora freigegeben werden sollen — eine Creative-Commons-Lizenz der Version 
4.0, die das Leistungsschutzrecht des Datenbankherstellers mitlizenziert, so- 
dass bei Nachnutzung die bekannten CC-Lizenzbedingungen wie Namensnen- 
nung, ShareAlike usw. gelten.” 


29 Bei Lizenzversion 3.0. wird das Datenbankherstellerrecht durch Freigabe mittels der Lizen- 
zen aufgegeben. 
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3.4.3 Erwägungen zur Lizenzwahl 


Die bei CLARIN in den drei Zugriffskategorien PUB (öffentlich verfügbar), ACA 
(Nutzer muss einer akademischen Einrichtung angehören) und RES (Beschränk- 
te Nutzung; zusätzliche Anforderungen müssen erfüllt sein) eingeordneten 
Lizenzen und Erklärungen sind durchweg Standardvereinbarungen, die vor 
allem Urheber- und Leistungsschutzrechte lizenzieren.*° 

Sofern überhaupt Rechte an Teilen der Korpora bestehen, scheide nach 
Empfehlung der Gutachter der Einsatz einer Aufgabeerklärung (Creative Com- 
mons-Lizenz CCO: Urheber überlässt Werk der Public Domain für freien Ge- 
brauch) aus, da die auftraggebenden Institutionen — soweit ersichtlich - an 
keinem der betroffenen Inhalte vollständig über alle Rechte verfügen könnten. 

Für die Korpora, an denen Datenbankherstellerrechte der involvierten Insti- 
tutionen bestehen, stünden grundsätzlich alle Lizenzoptionen unter CLARIN- 
PUB zur Wahl. Bei der Wahl der konkreten Lizenz sei allerdings zu beachten, 
dass die Creative-Commons-Lizenzen bis einschließlich Version 3.0 das Daten- 
bankherstellerrecht entweder ganz aussparen (gilt für die Fassungen „Generic“ 
bzw. „Unported“) oder sogar einen ausdrücklichen Verzicht auf dieses Recht 
enthalten (gilt für mehrere der für europäische Rechtsordnungen portierten 
Fassungen). Ab Version 4.0 sei das anders; eine Entscheidung für eine Creative- 
Commons-Lizenz der Version 4.0 erleichtere überdies die Nachnutzbarkeit der 
Ressource. 


4 Konsequenzen für die Aufbereitung der 
Korpusdaten 


Gemäß der Empfehlung d.) in 3.2.3.2 wurde das Teikorpus 1201000 (psychosozi- 
aler Beratungschat) vollständig aus dem Bestand gelöscht. Das Korpus wird im 
Rahmen der CLARIN-D-Forschungsinfrastrukturen (Repositorien und Korpus- 
recherchesysteme an den Institutionen BBAW und IDS) zur Verfügung gestellt. 
Um die weiteren Empfehlungen zu befolgen, wird das Teilkorpus mit denjeni- 
gen Chats, die aus geschlossenen Chat-Plattformen stammen, ausschließlich 
registrierten und akademisch affiliierten Nutzern zur Verfügung gestellt. 


30 Vgl. Oksanen et al. (2010). Das APR und das gesamte Datenschutzrecht werden von diesen 
Lizenzen nicht geregelt. 
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4.1 Anonymisierung 


Sowohl zur Minimierung rechtlicher und ethischer Risiken im Datenschutz 
(Abschnitt 3.2.1) als auch um zu untermauern, dass der Erlaubnistatbestand des 
823 BDSG für die Verarbeitung des Chatkorpus angenommen werden kann (Ab- 
schnitt 3.2.3.2), empfiehlt das Gutachten Standardmaßnahmen zur Anonymisie- 
rung personenbezogener Daten in den Chat-Protokollen bzw. eine Unkennt- 
lichmachung aller Elemente, die nicht nur unerhebliche Identifizierungsrisiken 
bergen. Beispiele für personenbezogene Daten werden in 3.2.1 genannt. 

Es wird argumentiert, dass eine Personenbeziehbarkeit dann nicht mehr 
gegeben ist, wenn ihre Herstellung einen klar unverhältnismäßigen Aufwand 
erfordern würde. Um also den erforderlichen Aufwand so weit wie möglich, d.h. 
unter Wahrung der Brauchbarkeit des Korpus für linguistische Untersuchun- 
gen, zu erhöhen, werden Standardmaßnahmen zur Anonymisierung empfoh- 
len, als Beispiele werden genannt: Randomisierung von Hostnamen; Ersetzung 
der Nicknames, Ortsnamen, Expertennamen; Anonymisierung, Entfernung oder 
Permutierung der Zeitstempel. 

Weiterhin werden in 3.2.3.2 Variablenunterdrückung, Objektunterdrü- 
ckung, Informationsreduktion, Zufallsvertauschungen und Zufallsüberlagerun- 
gen als mögliche Anonymisierungsmethoden genannt. Diese Verfahren werden 
in Höhne (2010) genauer definiert, sie beziehen sich allerdings auf personenbe- 
zogene, u.a. numerische Mikrodaten, die in einer oder in mehreren aggregierba- 
ren Datenbank-Tabellen vorliegen. Im Folgenden orientieren wir uns vorwie- 
gend an der Literatur zur Anonymisierung von textuellen Daten. Dort spricht 
z.B. Medlock (2006) von Kategorisierung (was einer Variablenunterdrückung mit 
Ersatzinformation nach Höhne (2010) zu entsprechen scheint) und von Pseudo- 
nymisierung (ein Vertauschungs- bzw. Austauschungsverfahren). 

Um einen Überblick a.) über weitere mögliche Typen von sensiblen Refe- 
renzen, d.h. referenziellen sprachlichen Ausdrücken im Chatkorpus, die poten- 
ziell anonymisiert werden müssen und b.) über mögliche Verfahren zur Un- 
kenntlichmachung oder Neutralisierung der sensiblen Referenzen zu gewinnen, 
sichteten wir aktuelle Literatur zu Anonymisierungsverfahren für Sprachkorpo- 
ra sowie Beschreibungen von durchgeführten Anonymisierungen in Projekten 
zum Aufbau von IBK-Korpora, darunter zwar keine Chatkorpora, aber ein E- 
Mail-Korpus (Medlock 2006), ein Facebook-Korpus (Didi 2015), zwei SMS- 
Korpora (Pankhurst et al. 2013, Ueberwasser 2015), sowie eines Gesprächskor- 
pus (Winterscheid 2015). 
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4.1.1 Kategorien 


Damit ein Korpus noch auf vernünftige Weise für linguistische Untersuchungen 
verwendet werden kann, empfiehlt Medlock (2006), dass sensible Referenzen 
nicht einfach entfernt werden, sondern kategorisiert, d.h. ersetzt werden durch 
einen Platzhalter, der die Kategorie des ersetzten Elements (wie Personenname 
oder Ortsname) wiedergibt, oder sogar, pseudonymisiert, d.h. ersetzt werden 
durch eine Variante aus derselben Kategorie (beispielsweise indem der Vorna- 
me Holger durch Werner ersetzt wird). Anonymisierung ist dann der Oberbegriff 
für Kategorisierung, Pseudonymisierung oder weitere mögliche Verfahren. Der 
Aufwand für eine ordentliche Pseudonymisierung von sensiblen Referenzen ist 
allerdings deutlich höher als der für eine Kategorisierung, da eine Konsistenz 
der Ersetzungen auch bzgl. Formvarianten gewährleistet sein sollte (Werners für 
Holgers, weeeerners für hoooolgers etc.), wofür ausführliche Maskierungstabel- 
len (vgl. Winterscheid 2015) erstellt werden müssen. Im Falle des Chatkorpus 
wurde daher, wie in den von uns betrachteten anderen IBK-Korpusprojekten, 
die Anonymisierung als Kategorisierung durchgeführt; dies schließt natürlich 
eine spätere Pseudonymisierung, um die Nutzbarkeit noch weiter zu verbes- 
sern, nicht aus. 

Da die meisten Elemente, die im Chatkorpus anonymisiert werden mussten, 
Namen sind, berufen wir uns zunächst auf die fünf Named Entity-Kategorien 
PER, ORG, LOC, GPE, OTH, die in der TüBa-D/Z Baumbank (Telljohann et al. 
2004) annotiert wurden (vgl. Tabelle 1) und die bereits in Experimenten zur 
Named Entity Recognition für DEREKO verwendet wurden (Bingel/Haider 2014). 
Da die fiinf Kategorien dieses Sets recht weit gefasst sind und in einigen Fallen 
die vorhandenen Annotationen der Ausgangsressource bereits spezifischere 
Informationen enthielt, erweiterten wir das Set um die Kategorien NICK (fiir 
Nickname, als Unterkategorie von PER) und ROOM (fiir den Namen eines Chat- 
rooms). Zusätzlich wurde die Kategorie GEO_DE fiir Substantive oder Adjektive, 
die von einem Namen (zumeist LOC oder GPE) abgeleitet sind (Dortmunder) 
(GEO_DE entspricht einer Vereinigung der beiden Kategorien _GeoNE_ und 
_GeoADJA_ aus DiDi 2015). 

Neben den Kategorien fiir Namen werden drei weitere Kategorien fiir forma- 
lere Referenzen eingeführt: URL (für eine WWW-Adresse), EMAIL (für eine E- 
Mail-Adresse) und NUMBER (für jegliche Art von referenzierender Nummer, 
Beispiele s. Tabelle 1). Angelehnt an Winterscheid (2015) bzw. DiDi (2015) führen 
wir die beiden selteneren, aber dennoch relevanten Kategorien IMPLICIT (für 
eine implizite Referenz) und CITATION (für ein Zitat, das zur Identifizierung 
eines Individuums verwendet werden könnte) ein. 
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Alle 13 verwendeten Anonymisierungskategorien sind in Tabelle 1 mit ge- 
naueren Definitionen, Beispielen und Angabe der Quelle bzw. Anregung für die 
Kategorie aufgeführt. 


Tab. 1: Anonymisierungskategorien im Dortmunder Chatkorpus 2.0. 


# Kurzform Langform und Definition/Beispiele Quelle bzw. #Vorkommen 
Beschreibung/ Erläute- Anregung für nach Anony- 
rung Kategorie misierung, 

> = 39519 

NAMEN 

1 PER PERSONNAME “Erwin”, TüBaDZ 838 
Personenname: Vorna- “Meike”, (Telljohann 
me oder Nachname “Anna Hein” et al. 2004) 


oder Sequenz aus 
Vorname und Nachna- 


me 
2 NICK NICKNAME “batman”, Dortmunder 30022 
Nickname: Benutzer- “nana2” Chat 
name, den ein Chatteil- “Eule” Korpus 
nehmer sich gegeben “Domain5”, 
hat, oder eine Variante “OhneWorte”, 
davon). NICK ist eine “markus538" 


Unterkategorie von 
PER, also immer wenn 
ein Nickname erkannt 
wurde, wurde NICK 
annotiert, ansonsten 


PER. 
3 ORG ORGANISATIONNAME “RUB”, TüBaDZ 741 
Organisationsname: “John Deere”, 
Firma (z.B. Arbeitgeber “ASV Schif- 
eines Teilnehmers), ferstadt” 


Sportverein, Institut, 
Universitat etc. 


NB: Bei einem Ausdruck 
wie “Universitat Hil- 
desheim” wurde nur 
“Hildesheim” anonymi- 
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# Kurzform Langform und Definition/Beispiele Quelle bzw. #Vorkommen 
Beschreibung; Erläute- Anregung für nach Anony- 
rung Kategorie misierung, 

> = 39519 


siert (Universität ist ein 
hinreichend allgemei- 
ner Ausdruck), und 
dieses dann als GPE. 


4 GPE GEOPOLITICALENTITY- “Mannheim”, TUBaDZ 1309 
NAME “NRW”, 
Geo-Political Entity: Ort “Italien” 
oder Gebiet, dessen “doaaadmund” 
Grenzen politisch- “DO” 


verwaltungsmäßig 
festgelegt sind, also 
alle Städte, Gemein- 
den, Länder, Bundes- 
länder, Stadtteile etc. 
inkl. Schreibvarianten 
und Abkürzungen 


davon. 
5 GEO_DE GEODERIVATIONNAME “Mannheimer”, DiDi (2015) 178 
Geo-Derivation: Sub- “Mannheimerin- 
stantiv oder Adjektiv, nen”, 
welches von einem “Gelbfüßler” 
Namen, meist GPE oder “Schwabe” 
LOC, morphologisch “sommer- 
abgeleitet ist und die lath'sche” 
Zugehörigkeit oder “doadmunder” 


Eigenschaft (Adjektiv) 
oder eine Gruppe oder 
Bewohner (Substantiv) 


bezeichnet. 
6 LOC LOCATIONNAME “Augustaanlage”, TüBaDZ 107 
Location: Ort oder “Neckar”, 


Gegend, der oder die “Königstuhl” 
nicht politisch definiert “A6” 

ist, z.B. Berg, Tal, Fluss, 

Straße, Autobahn etc. 


7 OTH OTHERNAME “bravo” TüBaDZ 1819 
Other: Restkategorie 
für alles was sonst (=Name einer 
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# Kurzform _Langform und Definition/Beispiele Quelle bzw. #Vorkommen 
Beschreibung/ Erläute- Anregung für nach Anony- 
rung Kategorie misierung, 

> = 39519 


nicht zugeordnet wer- 


Zeitschrift bzw. 


den kann (Namen und einer Chat- 
Referenzen, z.B. auch Plattform) 
Bars) 
8 ROOM ROOMNAME “Welcome”, DO Chat- 2409 
Name eines Chatraums “emerald” korpus 
ÜBRIGE REFERENZEN 
9 URL WWWURL “http: //www.ids- 1742 
WWW-Adresse mannheim.de/” 
10 EMAIL EMAIL “sommer- 50 
E-Mail-Adresse lath@ids- 
mannheim.de” 
11 NUMBER NUMBER “0621/1581418”, 169 
Nummer: Jegliche Zahl “10.0.1.81”, 
oder Nummer oder “68161” 
Kodierung, die auf eine 
Person oder einen 
Gegenstand, der einer 
Person zugeordnet 
werden kann verweist: 
Hausnummer, Serien- 
nummer, Postleitzahl, 
Telefonnummer, Pass- 
nummer, Kontonum- 
mer, IP-Adresse, Pass- 
wort. 
12 IMPLICIT IMPLICIT Sein Hobby ist das 130 


Implizite Referenz: 
Aussagekräftige Be- 
schreibungen und 
Informationen, aus 
denen Rückschlüsse 
auf die Identität eines 
Chat-Teilnehmers oder 
eines Dritten gezogen 
werden kann. Inklusive 


Sammeln von 
„Weinflascheneti- 
ketten“, 
„IT-Operator“ 
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# Kurzform _Langform und Definition/Beispiele Quelle bzw. #Vorkommen 
Beschreibung; Erläute- Anregung für nach Anony- 
rung Kategorie misierung, 

> = 39519 


Berufsbezeichnungen, 
falls sie einen Hinweis 
auf eine Person geben. 


13 CITATION CITATION 5 
Zitat: Zitate einer ande- 
ren Person, oder aus 
einem Werk, das zur 
Identifizierung eines 
Teilnehmers oder eines 
Dritten verwendet 
werden könnte. 


4.1.2 Technische Umsetzung 


Die Ausgangsressource enthielt in den Metadaten jedes Chatprotokolls bereits 
eine Liste der Chatteilnehmer (,,creatorList“) mit Angabe einer ID, ihres Ge- 
schlechts und ihrer Rolle im Chat (wie „teacher“ oder „expert“). In den eigentli- 
chen Chat-Texten waren Nicknames und Anreden anderer Teilnehmer (@ Willi) 
bereits annotiert, in der Regel mit einer Verlinkung in die Teilnehmerliste. 
Ebenso waren die Namen der Chaträume als solche annotiert (sie erscheinen 
vorwiegend in Statusmeldungen des Chat-Systems). Diese vorhandenen Anno- 
tationen wurden in das TEI-Format des Kurationsprojekts (‚CLARIN D-TEI-CMC’, 
vgl. Abschnitt 2) konvertiert und bildeten den Ausgangspunkt für Schritt 1 der 
Anonymisierung. Die Teilnehmerliste erscheint im CLARIN-D-TEI als <partic- 
List>, im eigentlichen Chat-Textbereich sind Nicknames mit <name ty- 
pe=“NICK“> annotiert, Adressierungen mit <ref type=“addressingTerm“> und 
die Referenzierung in die <particList> des TEI-Headers erfolgt TEI-konform per 
@who bzw. @corresp. 

Die Dateinamen enthielten teilweise die Namen von Chatplattformen; sie 
wurden über eine Mapping-Liste anonymisiert, die die Teilstrings mit sensiblen 
Referenzen auf thematische Bezeichner wie „Politik-Portal“ abbildete. Die Chat- 
Teilnahme oder Erwähnung von Personen des öffentlichen Lebens wie Politi- 
kern und Prominenten gilt als nicht-sensibel, die Vorkommen solcher Namen 
wurden also nicht anonymisiert. 
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Schritt 1 - Automatische Anonymisierung durch ein XSLT-Stylesheet: Der 
String-Inhalt aller bereits annotierten Nicknames und Adressierungen wurden 
getilgt und durch einen kategorisierenden Platzhalter ersetzt. Ein Platzhalter- 
String bestehen aus folgenden drei Teilstrings: a.) dem Inhalt des @sex- 
Attributes des Chat-Teilnehmer, aus dem entsprechenden <person>-Element in 
der <particList> im TEI-Header.; b.) dem Inhalt des @role-Attributes des Teil- 
nehmers, oder falls es kein @role gab, der String „PARTICIPANT“ und c.) der 
@xml:id des Teilnehmers (vgl. Listing 1). Diese „sprechenden“ Ersetzungs- 
Strings wie „FEMALE-TEACHER-AO08“ ersetzen den textuellen Inhalt der <na- 
me>-Annotationen wie auch der Attribute @lemma und @normal (normalisierte 
Form) eines zu anonymisierenden <w>-Elements, sowie auch den Textinhalt 
von <persName> im TEI-Header in der Teilnehmerliste selbst (Listing 1). Sollte 
die Annotation von <name> oder <ref> keine Referenzierung in die <particList> 
enthalten, so können ID, Geschlecht und Rolle nicht automatisch ermittelt wer- 
den und der Ersetzungsstring lautet lediglich „NICKNAME“. Beispiele für das 
Zielformat nach dem automatischen Anonymisierungsschritt finden sich in 
Listing 1, 2 und 4. 

Schritt 2 - Manuelle Anonymisierung: In einer Kampagne mit vier Hilfskräf- 
ten der Universität Mannheim, der Universität Duisburg-Essen und des IDS 
wurde in dem gesamten Chatkorpus verbleibende sensible Referenzen wie unter 
Abschnitt 4.1.1 definiert mit Hilfe des „Author Mode“ des XML-Editors Oxygen 
identifiziert und mit dem Kategorienlabel-Inventar aus Tabelle 1 annotiert. Das 
Resultat wird derzeit geprüft und dann durch ein weiteres Stylesheet in die TEI- 
Annotation analog zu Schritt 1 überführt: Namen werden mit <name>, übrige 
Referenzen mit <ref> umgesetzt, dabei wird die Kurzform des Kategorienlabels 
im @type-Attribut festgehalten und die Langform im Ersetzungs-String; der 
Ersetzungs-String erscheint wiederum als Textinhalt und als Inhalt der Attribute 
@lemma und @normal, wenn vorhanden. Beispiele für die Umsetzung von 
manuell annotierten Kategorien finden sich in den Listings 3 und 4. 

Das Chatkorpus 2.0 enthält rund 1,06 Millionen Tokens, davon wurden nun 
insgesamt 39519 Einheiten (Wortbestandteile, Wörter oder Mehrworteinheiten) 
anonymisiert. Wie oft eine Anonymisierungskategorie zugewiesen wurde, zeigt 
die letzte Spalte von Tabelle 1. 
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Listing 1: Anonymisierung von Metadaten (Teilnehmerliste). Personen des öffentlichen Lebens 
(Prominente, Politiker) werden nicht anonymisiert. 


<particDesc> 
<!-- 1301005 --> 
<listPerson> 
<le- i.. > 
<person role="celebrity" xml:id="A03"> 
<persName type="NICK">Günther Beckstein</persName> 
<sex evidence="estimated">male</sex> 
</person> 
<l- -=> 
<person role="moderator" xml:id="A04"> 
<persName type="NICK">[_MALE-MODERATOR-A04_]</persName> 
<sex evidence="estimated">male</sex> 
</person> 
<l- l.. -=> 
<person role="participant" xml:id="A07"> 
<persName type="NICK">[_FEMALE-PARTICIPANT-A07_]</persName> 
<sex evidence="estimated">female</sex> 
</person> 
<person role="participant" xml:id="A08"> 
<persName type="NICK">[_PARTICIPANT-AO8_]</persName> 
<sex evidence="estimated">unknown</sex> 
</person> 
Sl -=> 
</listPerson> 
</particDesc> 


Listing 2: Anonymisierung eines Nicknames ohne Rolleneintrag in Teilnehmerliste 


<post auto="false" rend="color:lime" type="event" who="#A14" xml:id="m487"> 

<name corresp="#A14" type="NICK"> 

<w lemma="[_PARTICIPANT-A14_]" type="NE" xml:id="m487.t1"> 

[_PARTICIPANT-A14_]</w> 

</name> 

<w lemma="werden" type="VAFIN" xml:id="m487.t2">wird</w> 

<w lemma="schlecht" type="ADJD" xml:id="m487.t3">schlecht</w> 
</post> 
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Listing 3: Anonymisierung einer Ableitung von einem Namen (wie Düsseldorfern) 


<w lemma="auch" type="ADV" xml:id="m40.t1">auch</w> 
<w lemma="bei" type="APPR" xml:id="m40.t2">bei</w> 
<w lemma="die" type="ART" xml:id="m40.t3">den</w> 
<name type="GEO_DE"> 

<w lemma="[_GEODERIVATIONNAME_]" type="NN" 
xml:id="m40.t4">[_GEODERIVATIONNAME-4_]</w> 
</name> 


Listing 4: Anonymisierung einer impliziten Referenz (Studienfach eines Teilnehmers) 


<post auto="false" rend="color:#808080" synch="#t427" type="standard" 
who="#A26" xml:id="m576"> 
<w lemma="wollen" type="VMFIN" xml:id="m576.t1" >willst</w> 
<w lemma="du" type="PPER" xml:id="m576.t2">du</w> 
<w lemma="eine" type="ART" xml:id="m576.t3">ne</w> 
<w lemma="Therapie" type="NN" xml:id="m576.t4">therapie</w> 
<ref corresp="#A31" type="addressingTerm"> 
<w lemma="@" type="ADRIND" xml:id="m576.t5">@</w> 
<w type="NE" xml:id="m576.t6">[_MALE-PARTICIPANT-A31_]</w> 
</ref> 
<w lemma="ich" type="PPER" xml:id="m576.t7">ich</w> 
<w lemma="studieren" type="VVFIN" xml:id="m576.t8">studier</w> 
<ref type="IMPLICIT"> 
<w type="NE" xml:id="m576.t9">[_IMPLICIT-1_]</w> 
</ref> 
</post> 


4.2 Lizenzwahl 


Da die Datenbankherstellerrechte (3.4.2) für die Aufbereitung zumindest zu 
einem Teil bei dem CLARIN-D-Kurationsprojekt liegen, und da die Verantwortli- 
chen für den Aufbau der ursprünglichen Ressource gleichzeitig Mitglieder des 
Kurationsprojekts waren, wurde die Ressource gemäß der Empfehlung in 3.4.3 
mit dem Lizenztyp CC-BY 4.0 versehen. 
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5 Fazit und Ausblick 


Die unklare rechtliche Situation in Bezug auf die Speicherung, Aufbereitung 
und Wiederbereitstellung von Sprachdaten internetbasierter Kommunikation ist 
einer der wesentlichen Gründe dafür, weshalb bislang kaum frei verfügbare 
Korpora zu diesem wichtigen Kommunikationsbereich existieren. Für die Ein- 
schätzung der rechtlichen Situation und der daraus für die Auswahl und Reprä- 
sentation von Korpusdaten erwachsenden Konsequenzen fehlt Linguisten, Kor- 
pus- und Computerlinguisten die juristische Expertise. 

In diesem Beitrag berichteten wir über die Ergebnisse eines Rechtsgutach- 
tens, das im Rahmen des CLARIN-D-Kurationsprojekts ChatCorpus2CLARIN in 
Auftrag gegeben wurde und das die Bedingungen für die Integration eines Kor- 
pus mit bereits erhobenen Chat-Daten in die Korpusinfrastrukturen des BMBF- 
Verbundprojekts CLARIN-D klären sollte. 

Die Erstellung des Rechtsgutachtens gestaltete sich als sehr aufwändig. 
Zwar wurde das Gutachten durch einen externen Auftragnehmer - die Kanzlei 
iRights.law — erarbeitet; auch verfügte der Auftragnehmer bereits über einschlä- 
gige Expertise in Bezug auf digitale Daten. Um eine geeignete Basis für die Ein- 
schätzung der Ressource zu schaffen, war allerdings eine Erweiterung der vor- 
handenen Dokumentation zu den Korpusdaten und waren insbesondere 
mehrere Rückfrage- und -klärungsschleifen zwischen Projektbeteiligten und 
Juristen erforderlich, so dass die endgültige Fassung des Gutachtens erst kurz 
vor Projektende vorlag. 

Die Ergebnisse des Gutachtens machten es erforderlich, einen Teil des Da- 
tenbestands aus der Ressource zu entfernen. Die übrigen Korpusdaten wurden 
von Grund auf neu anonymisiert. Für die Anonymisierung wurden Best Prac- 
tices aus existierenden Textkorpora sowie aus anderen Korpora internetbasier- 
ter Kommunikation aufgegriffen und für Zwecke des Chat-Korpus angepasst. 

Ein schon länger existierendes Korpus nachträglich rechtlich zu prüfen, wie 
im hier berichteten Projekt der Fall, ist sicherlich um einiges aufwändiger als 
die rechtliche Situation vor Beginn der Datensammlung einzuschätzen und 
davon ausgehend erforderliche Weichenstellungen bereits auf der Ebene der 
Erhebung von Daten und Metadaten vorzunehmen. Dennoch ist auch bei Kor- 
pusprojekten, die erst am Anfang stehen, davon auszugehen, dass, wie auch im 
vorliegenden Fall, für eine Einschätzung der rechtlichen Situation am konkre- 
ten Einzelfall verschiedene rechtliche Teilgebiete gegeneinander abgewogen 
werden müssen (Datenschutzrecht, Persönlichkeitsrecht, Urheber- und Leis- 
tungsschutzrecht). 
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Hilfreich fiir die Konzeption von Korpora bzw. von jeder Art datengestiitzter 
Forschung auf Basis von Daten internetbasierter Kommunikation bzw. aus ,so- 
zialen Medien’ ware die Entwicklung von rechtlichen Leitlinien, die beim Um- 
gang mit solchen Daten grundsätzlich zu bedenken sind. Die Entwicklung sol- 
cher Leitlinien kann nicht im Rahmen eines einzelnen Korpusprojekts geleistet 
werden und bedarf der Mitwirkung von Juristen. Sie könnte eine lohnenswerte 
Aufgabe für Ressourceninfrastrukturinitiativen wie CLARIN und ihre nationalen 
Partnerprojekte sein. 
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Burkhard Dietterle, Anke Lüdeling und Marc Reznicek 
Zur Syntax in Plauderchats 


1 Einleitung und Motivation 


Dieser Beitrag beschäftigt sich mit zwei eng miteinander verbundenen Fragen: 

1. Wie können die syntaktischen Strukturen in Chat-Mitschnitten beschrieben 
werden? 

2. Welche syntaktischen Eigenschaften haben deutsche Chat-Mitschnitte? 


Viele Typen von Chats weichen in verschiedenen Hinsichten von einer schriftli- 
chen ‚Standardsprache‘ ab. Uns interessiert in diesem Beitrag vor allem die 
Syntax von Äußerungen! aus sogenannten Plauderchats, also nicht- 
professionell erstellten und für jedermann zugänglichen Webchat- und IRC- 
Angeboten’. Im weiteren Verlauf des Artikels beziehen wir uns der einfacheren 
Handhabung halber mit ,Chat’ bzw. ‚Chat-Sprache’ speziell auf die hier unter- 
suchten Plauderchats. Eine Verallgemeinerung der Ergebnisse auf andere Chat- 
Typen ist nicht ohne weiteres möglich. 

In Abschnitt 2 werden wir zunächst auf einige Grundannahmen von syntak- 
tischen Beschreibungen eingehen und erläutern, warum diese für die Analyse 
von Chat-Daten nicht immer geeignet sind. In Abschnitt 3 werden wir die Chat- 
Daten und deren Vorverarbeitung in dem von uns erstellten NoSta-D-Korpus 
vorstellen, welches Sprachmaterial aus mehreren Varietäten, insbesondere 
auch aus Nichtstandard-Varietäten des Deutschen, enthält. In Abschnitt 4 wer- 
den wir schließlich auf einige syntaktische Eigenschaften der Daten genauer 
eingehen. 


1 Wir verwenden den Begriff ‚Äußerung‘ hier prätheoretisch. Technisch sind Chats in Postings 
eingeteilt, ein Posting kann mehrere Äußerungen enthalten. Für eine Modellierung der Struk- 
tur von Chat-Daten vgl. Beißwenger et al. (2012). 

2 http://www.chatkorpus.tu-dortmund.de/bestand.html, vgl. Abschnitt 3. 
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2 Nichtstandardsprache: syntaktische 
Eigenschaften 


Der Begriff ‚Standardsprache‘ ist problematisch’, aber was auch immer unter 
‚Standardsprache‘ verstanden wird, die Sprache in Chats wird darunter sicher 
meist nicht mitverstanden. 

Fast alle Grammatiken (unabhängig davon, ob sie deskriptiv oder theore- 
tisch ausgerichtet sind und welcher Theorie sie folgen) beschreiben konzeptio- 
nell schriftliche, geplante Register. Als wesentliche Einheit der syntaktischen 
Beschreibung wird immer ein Satz angenommen. Auch für den Begriff ‚Satz‘ 
gibt es unterschiedliche Definitionen, man kann aber verallgemeinernd sagen, 
dass als Satz ein finites Verb samt aller abhängigen Konstituenten (Argumente, 
Komplemente, Ergänzungen) sowie ggf. vorhandenen Modifikatoren (Adjunkte, 
Angaben) definiert wird. In vielen Registern und Varietäten des Deutschen 
kommen nun jedoch Äußerungen vor, die gemäß solch einer Definition keine 
Sätze sind und daher nicht wie Sätze analysiert werden dürfen. Dies betrifft 
beispielsweise Äußerungen mit Unflüssigkeiten (disfluencies, vgl. z.B. Eklund 
2004 für einen Überblick) ebenso wie Äußerungen ohne Verb (Behr/Quintin 
1996), Äußerungen ohne Subjekt (Schalowski 2009) oder andere nach Stan- 
dardgrammatiken ‚unvollständige Äußerungen‘ (vgl. Reich 2011 zum Unter- 
schied zwischen Ellipsen, die aus dem Satzkontext ergänzt werden können, und 
Auslassungen, in denen die Situation für das Verständnis bekannt sein muss). 
Wir möchten dies zunächst an einem kurzen Abschnitt aus dem von uns behan- 
delten Chat illustrieren (für die Referenz siehe Abschnitt 3). Hier unterhalten 
sich die Chatteilnehmer TomcatMJ und Bochum über einen Umzug. Die Äuße- 
rung in Posting 221° enthält kein Verb, trotzdem kann man sie problemlos ver- 
stehen. Eine Möglichkeit, dies zu erklären, ist, dass man implizit eine ‚kanoni- 
sche‘ Syntax annimmt, die ein Verb enthält und beispielsweise aussehen 


3 Eine Aufarbeitung der Thematik ‚Standardsprache‘ sprengt den Rahmen dieses Beitrags. Nur 
wenige Grammatiken thematisieren ihre Beschreibungsgrundlage überhaupt (Eisenberg 2007 
definiert Standardsprache als die Sprache überregionaler Tageszeitungen, die Dudengramma- 
tik 2005 (Duden 4) hat einen Abschnitt zu gesprochener Sprache, geht aber in allen anderen 
Abschnitten auch implizit von einer geschriebenen, geplanten Varietät mit vollständigen 
Sätzen aus). Diskutiert wird die Beschreibungsgrundlage von Grammatiken und der Begriff 
‚Standardsprache‘ ausführlicher in Beschreibungen von bestimmten ‚Nichtstandard‘- 
Varietäten, vgl. z. B. Hennig (2006) oder Maas (2010) zu gesprochener Sprache oder Wie- 
se/Freywald/Mayr (2009) zu Kiezdeutsch. 

4 Die Nummerierung folgt dem NoSta-D Chatkorpus. 
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könnte wie die Struktur in (1b). Ohne Verb kann man zwar den einzelnen Be- 
standteilen eines Satzes bestimmte Informationen zuordnen (z.B. Flexionsin- 
formationen wie Kasus), aber eigentlich keine grammatischen Funktionen wie 
Subjekt oder Modifikator, da die grammatischen Funktionen inhärent relational 
sind (ein Subjekt ist immer ein Subjekt von einem Verb). 


(1a) 


221 eigentlich kostet so|°was die miete für nen Ikw für nen tag und verköstigung für nen 
haufen helfender freunde @ zora 


222 bochum-münster ohne küche 3500 euro .. 


(1b) 


222 [Bochum-Münster ohne Küchelsus; kostet [3500 Euro]mop. 


Wenn - wie in Beispiel (la) — nur unverbundene ‚Chunks‘ oder Phrasen als 

Analysemittel zur Verfügung stehen, bleibt viel Information unzugänglich. Die 

Ergänzung in (1b) wird normalerweise implizit vorgenommen und es gibt oft 

viele Möglichkeiten, eine Äußerung zu ergänzen. Wir werden in Abschnitt 3 

eine Methode vorstellen, in der man solche Ergänzungen explizit macht. 
Konzeptuell kann man bei der Beschreibung von solchen ‚Nichtstandardva- 

rietäten‘ zwei Wege gehen, die beide in der Literatur vorgeschlagen und disku- 
tiert werden: 

1. Man formuliert eine spezifische Grammatik je Varietät. 

2. Man formuliert eine übergreifende Grammatik und versteht die Varietäten 
als spezifische Instanziierungen dieser einen Grammatik (spezifisch in Be- 
zug auf die Gewichtung der von der Grammatik zur Verfügung gestellten 
Strukturen). 


Wenn man für jede Varietät eine spezifische Grammatik annimmt, kann man 
alle Besonderheiten bis ins kleinste Detail analysieren und entgeht der sog. 


5 Dies ist ein wenig vereinfacht dargestellt: Ein Subjekt ist immer ein Subjekt von einem Prä- 
dikat. Prädikate sind in den meisten Sprachen und auch im Deutschen häufig, aber nicht 
notwendig Verben. 

6 In NoSta-D werden konkurrierende Tokenisierungen zwischen Original und Normalisierung 
durch den Pipe-Charakter (|) markiert. Für eine ausführlichere Behandlung siehe Abschnitt 
4.3.1. 


50 — Dietterle/Lüdeling/Reznicek 


comparative fallacy (Bley-Vroman 1983), d.h. der Versuchung, eine Varietät 
durch unpassende und unzutreffende Kategorien einer anderen Varietät zu 
beschreiben. Man kann dann allerdings Varietäten nicht direkt und vor allem 
nicht quantitativ (zum Beispiel für Registerstudien, vgl. Biber 1999, Bi- 
ber/Conrad 2009) miteinander vergleichen. Daher wählen wir hier einen An- 
satz, der zunächst aussieht wie Option 2: Wir formulieren eine kanonische Ebe- 
ne (Normalisierungsebene oder auch Zielhypothese genannt)’, die es uns 
ermöglicht, alle Varietäten - also einschließlich (statt ausschließlich!) ver- 
schiedener Chats - auf die gleiche Weise zu beschreiben (vgl. Hirsch- 
mann/Doolittle/Lüdeling 2007). Dabei ist es uns wichtig, dass dies eine rein 
methodische Entscheidung ist und wir damit nichts über eine kognitive ‚Wahr- 
heit‘ aussagen wollen. Auch soll unser Ansatz nicht sprachpflegerisch verstan- 
den werden, unsere kanonischen Ebenen sind nicht als ‚Verbesserungen‘ zu 
verstehen. 

Viele der vorliegenden theoretischen oder deskriptiven grammatischen Mo- 
delle können nicht alle Phänomene, die in Chats vorkommen, adäquat erfassen. 
Durch den Abgleich mit einer kanonischen Ebene können wir jedoch diejenigen 
Stellen finden, die grammatisch interessant sind. Um die Eigenschaften von 
Chats gut zu verstehen, müssen wir auch wissen, wie sich gewisse Chats von 
anderen Varietäten — wie zum Beispiel von gesprochenen Varietäten oder Zei- 
tungssprache - unterscheidet. 

Unser Korpus mit Originaltexten und zugehörigen Annotationen wird in ei- 
ner Mehrebenenarchitektur bereitgestellt, die es möglich macht, alle Original- 
text-Informationen zu erhalten und beliebige weitere Annotationsebenen hin- 
zuzufügen. Die Hinzufügung einer kanonischen Ebene bedeutet also nicht, dass 
der Originaltext verändert wird, sondern dass der Originaltext um eine explizite 
Interpretation ergänzt wird. In Abschnitt 4 zeigen wir einige Eigenschaften von 
Chats, die sich auf diese Weise finden und beschreiben lassen. Vorher möchten 
wir die Aufbereitung der Daten genauer erläutern. 


7 Die Grundidee für diese Normalisierungsvariante stammt aus der Annotation von Lernerda- 
ten. Vgl. Lüdeling (2011) und Reznicek/Lüdeling/Hirschmann (2013) für eine ausführliche 
Motivation und Beschreibung. 
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3 Annotation der Chat-Daten im NoSta-D-Korpus 


Die Chat-Daten, die im Folgenden beschrieben werden, stammen aus dem 
Dortmunder Chat-Korpus (DCK, Beißwenger 2013) und wurden im Rahmen des 
Clarin-D-Kurationsprojekts „Linguistische Annotation von Nichtstandardvarie- 
täten — Guidelines und ‚Best Practices‘“ als ein Teil eines Korpus mit Nichtstan- 
dardvarietäten (NoSta-D)® (Dipper/Lüdeling/Reznicek 2013) aufbereitet. Zweck 
des NoSta-D-Korpus ist der quantitative und qualitative Vergleich der darin 
enthaltenen fünf Nichtstandardvarietäten und einer Standardvarietät. 


Tab. 1: NoSta-D-Korpus v1.5: Subkorpora 


Subkorpus Varietät #Tokens #Segmente Quelle 


original normalisiert 


1 Anselm-Corpus historisch 1.084 1.273 8 Bochum 

2 DCK (unicum) Plauderchat 3.699 4.731 787 Dortmund 
3 BeMaTaC gesprochen 7.991 11.164 1.791 Berlin 

4 Falko Lerner 2.777 2.865 144 Berlin 

5 Kafka: Der Prozeß lit. Prosa 4.869 4.993 200 DigBib.Org 
6 Tüba-D/Z (subset) Zeitung 4.996 5.118 295 Tübingen 


NoSta-D-unicum, das Chat-Subkorpus von NoSta-D enthält 3.699 Tokens in 787 
Segmenten aus einem Mitschnitt von der unmoderierten Plauderchat-Plattform 
unicum (unicum_21-02-2003_1°). In Abschnitt 4 werden wir diese Daten verglei- 
chen mit Daten aus NoSta-D-bematac”, einem Korpus mit mündlichen Map- 
Task-Dialogen, und NoSta-D-tuebadz, einem Ausschnitt aus dem TüBa-D/Z- 
Korpus mit Zeitungssprache. Alle Subkorpora wurden gemäß eigens für NoSta- 


8 Das Korpus ist verfügbar unter https://www.linguistik.hu-berlin.de/institut/professuren/ 
korpuslinguistik/research/nosta-d. 

9 http://www.chatkorpus.tu-dortmund.de/files/releasehtml/html-korpus/unicum_21-02- 
2003_1.html. 

10 Zu BeMaTaC vgl. Sauer/Lüdeling (2016). 


52 — Dietterle/Lüdeling/Reznicek 


D zusammengestellten Richtlinien fiir Vorverarbeitung und Annotation” er- 
stellt. 

Die Kernidee dieser Richtlinien ist es, die Interpretation und Annotation des 
Originaltextes nicht in einem Schritt zu vereinen, sondern in zwei Schritte zu 
trennen: 

1. Eine Interpretation des Originaltextes wird in der bereits erwähnten kano- 
nischen Ebene fixiert. 

2. Sämtliche Annotationen am Originaltext werden nicht durch den Original- 
text selbst motiviert, sondern durch die kanonische Ebene. 


In Schritt 1) werden die Originaltexte aus den verschiedenen Varietäten auf 
Texte einer Normalisierungsvarietät abgebildet, wobei die Abbildung nach aus- 
gearbeiteten Richtlinien für alle Originaltexte gleichermaßen erfolgt. Bei den 
normalisierten Texten handelt es sich in keiner Weise um „korrekte” Versionen 
der Originale. Sie dienen, wie oben beschrieben, lediglich als Tertium Compara- 
tionis. Die normalisierten Daten werden in Schritt (2) wie unten erläutert anno- 
tiert. 


3.1 Vorverarbeitung 


Die Annotation syntaktischer Strukturen hängt in hohem Maße vom Ergebnis 
der Vorverarbeitung der Daten ab. Für NoSta-D-unicum sind hier folgende 
Schritte entscheidend: Linearisierung, Satzsegmentierung, Tokenisierung, 
Normalisierung und Wortarten-Tagging. 


3.1.1  Linearisierung 


Die Originaldaten des DCK liegen in einem HTML-Tabellenformat vor. Schrei- 
beralias und Schreiberbeitrag (Posting) stehen in getrennten Spalten, wie in (2) 
zu sehen. In NoSta-D-unicum wurde aus rein technischen Gründen der Schrei- 
beralias gelöscht, bei der Linearisierung entfallen also die Schreiberwechsel. 
Die dialogische Struktur geht zwar verloren, dies ist für die folgende satzbasier- 
te syntaktische Beschreibung allerdings unerheblich. 


11 Siehe NoSta-D Projekt-Webseite (Fußnote 9). 
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(2) 

1 System JustChat 4.0r0.204 (55.204) developed by Medium.net. 
2 System Du betrittst den Raum. 

3 Quaki was echt zori? 

4 System little15 betritt den Raum. 

5 Quaki das kiissen?? 

6 Pharao na gut marc. kein servicepaket nr.1 für dich :) 

7 Zora was? 

8 System TomcatM) kommt aus dem Raum Go-Rin-No-Sho herein. 
9  TomcatM) Hi 

10 System TomcatM) ist wieder da. 


3.1.2 Satzsegmentierung 


Wie in Abschnitt 2 ausgeführt, ist für die meisten grammatischen Beschreibun- 
gen die wesentliche Einheit ein Satz. Auch in NoSta-D werden Texte in Sätze 
segmentiert. Als Satzsegment gilt dabei eine kontinuierliche Tokenkette, über 
deren sämtliche Token ein (und nur ein) Dependenzgraph aufgespannt wird. 
Einem NoSta-D-Satzsegment entsprechen also kanonische Sätze im Sinne von 
Matrixsätzen inklusive aller ihrer abhängigen Sätze. Viele Postings in NoSta-D- 
unicum sind kanonische Sätze und können ohne weiteres als Satzsegmente in 
NoSta-D übernommen werden. Natürlich sind auch miteinander koordinierte 
Sätze gemäß Standardgrammatiken kanonisch und natürlich können koordi- 
nierte Sätze auch in einem NoSta-D-Satzsegment abgebildet werden. Auch in 
diesem Fall wird ein (und nur ein) Dependenzgraph über die gesamte Tokenket- 
te aufgespannt. 

Miteinander koordinierte Sätze werden in den geschriebenen Varietäten (al- 
so auch in den Chatdaten) dann über eine Koordinierungssatzkante (CS) mitei- 
nander verbunden, wenn sie durch Satzzeichen als asyndetische Koordination 
markiert sind. Ansonsten werden sie getrennt. Da die gesprochene Varietät 
diese Unterscheidung nicht zulässt, wurden hier alle Kandidaten für asyndeti- 
sche Koordination getrennt. Auf diese Weise geht keine Information verloren 
und die Vergleichbarkeit kann weiterhin hergestellt werden. 

Problematisch wird es, wenn eine Äußerung kein finites Verb enthält und 
daher nicht als Satz, sondern lediglich als Sequenz von (infiniten, nominalen, 
adverbialen usw.) Fragmenten analysiert werden kann. In solchen Fällen wird 
die Satzsegmentierung anhand der kanonischen Ebene motiviert, in der Verben 
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ergänzt werden (siehe Abschnitt 3.2.3). So werden Fragmente in ein Satzseg- 
ment aufgenommen, die sich ein gemeinsames Verb auf der kanonischen Ebene 
teilen (siehe (3) aus NoSta-D-bematac). Im Übrigen kann auch die Segmentie- 
rung kanonischer Sätze als eine Form der Segmentiertung verstanden werden, 
die anhand ihrer Normalisierung motiviert ist, mit der Besonderheit, dass das 
Verb in der kanonischen Ebene nicht ergänzt, sondern aus dem Originaltext 
übernommen wird. 


(3) 
18 | Original: dann | gehst | du | nach |rechts |bis |du |zum |Rad | Kommst 
19 | Original: ja 
Normalisierung | dann | gehst | du | nach | unten 
20 
Original dann |_ _ |nach| unten 


3.1.3 Tokenisierung 


Eine auffallige Eigenschaft von Plauderchat-Sprache besteht in der Haufung 

von nichtkanonischen Zusammenschreibungen.” Diese können in einem Kor- 

pus auf drei unterschiedliche Weisen tokenisiert werden: 

1. Als ein Token, das dann als komplexe syntaktische Einheit, die im Satz 
mehrere Funktionen erfüllen kann, zu beschreiben wäre. Beispielsweise ist 
das Element sparste in (4) als ein Token mit zwei syntaktischen Funktionen 


repräsentiert. 
(4) 
Token sparste den umzug 
syntaktische VERB + SUBJ DET OBJA 


Funktionen”? 


12 Vergleichbar mit einigen Zusammenschreibungen sind Verschmelzungen oder Klitisierun- 
gen in der gesprochenen Sprache, siehe Abschnitt 4.1. 
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2. Als zwei Token, die dann als zwei einfache syntaktische Einheiten zu reprä- 
sentieren wären. So wird sparste in (5) in die beiden Token sparst und e ge- 
trennt, denen jeweils eine Kategorie zugeordnet ist. '* 


(5) 

Token sparst e den umzug 
syntaktische VERB SUB) DET OBJA 
Funktionen 


Während in der ersten Tokenisierung beliebig viele (auch unvorhergesehene) 
kombinierte Tags entstehen könnten (zum Beispiel, weil es auch Kombinatio- 
nen aus mehr als zwei Elementen geben kann, siehe Abschnitt 4.1) und in der 
zweiten Tokenisierung die Information über die ursprüngliche Schreibung ver- 
loren geht, haben wir uns in NoSta-D für eine dritte Lösung entschieden: Wir 
trennen sparste in syntaktische Einheiten auf, markieren aber die ursprüngliche 
Zusammenschreibung durch einen senkrechten Strich („Pipe“-Charakter) am 
Ende der ersten der so aufgetrennten Einheiten. Jede Einheit bekommt nun eine 
eigene syntaktische Kategorie zugewiesen (siehe (6)). 


(6) 

Token sparst| e den umzug 
syntaktische VERB SUB) DET OBJA 
Funktionen 


Dieses Vorgehen ist besonders hilfreich im Bereich der Aktionswörter, die ganze 
Syntagmen verschmelzen (siehe (7)). In aktuellen Tokenisierungsguidelines fiir 
computervermittelte Kommunikation wie dem EmpiriST 2015” werden solcher- 
art Zusammenschreibungen als ein Token behandelt, was die interne Struktur 
von jeglicher weiterer syntaktischer Beschreibung ausnimmt. In NoSta-D lassen 


13 Die hier angedeutete Ebene „syntaktische Funktionen“ ist im Korpus nicht als Spanne wie 
im Beispiel, sondern als Label für die Kanten eines Dependenzgraphen gelöst. Die Abbildung 
dient nur zur Illustration der Tokenisierungsproblematik. 

14 Der Plosiv kann sowohl zum Verb als auch zum Pronomen gehören. Um die (unbeantwort- 
bare) Frage, wo genau segmentiert wird, geht es hier nicht. Uns ist wichtig, dass es zwei Ele- 
mente mit grammatischen Kategorien gibt. 

15 https://sites.google.com/site/empirist2015/home/annotation-guidelines. 
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sich die Subtokens des Originaltextes dagegen weiter analysieren (siehe Ab- 
schnitt 4.1). 


(7) 

Token * gegen] den| chat| und] emine| compil tret| * 
syntaktische $( APPR ART NN KON PPOSAT NN VVINF $( 
Funktionen 


3.1.4 Normalisierung 


Wie bereits erwähnt, dient die NoSta-D-Normalisierungsebene als Grundlage fiir 

eine vergleichende Analyse über unterschiedliche Varietäten hinweg. Gleichzei- 

tig motiviert sie die Annotationsentscheidungen für die Originaldaten, deren 

Strukturen ansonsten zu wenige Hinweise für eine Entscheidung zwischen kon- 

kurrierenden Annotationen geben würden. 

Die wichtigsten Schritte bei der Erstellung der Normalisierung für das Chat- 

Subkorpus sind: 

— Angleichung der Orthographie und Interpunktion an den Duden (Duden 1, 
2013) und Abbildung von reduzierten Formen auf Vollformen, wie in (8); 

— Standardisierung von Interjektionen und Namen der Chatteilnehmer (siehe 
(9)); 

—  Auffiillung von Ellipsen und Auslassungen. Um die Annotation von Frag- 
menten zu motivieren, werden in NoSta-D Ellipsen bzw. Auslassungen ex- 
plizit in der Normalisierung aufgefüllt. Das gilt für nichtrealisierte Verben in 
Satzfragmenten wie in (10) sowie fiir nichtrealisierte Argumente in Inflek- 
tiven wie in (11). Auf Ellipsen und Auslassungen gehen wir in Abschnitt 4.3 
näher ein. Die lexikalische und syntaktische Information der eingefügten 
Elemente wird entweder durch Parallelismus aus dem Kontext identifiziert 
oder durch allgemeine, semantisch relativ schwache Verben (z. B. sein, ha- 
ben) bzw. Dummy-Verben (,,VERBen”, „VERBst”) gefüllt. 


(8) 
Normalisierung: Lantonie redet wie eine Bewährungshelferin 


Original: Lantonie redet wie ne Bewährungshelferin 
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(9) 
Original Normalisierung 
ohhhh > Oh 
oh > Oh 
ohhhhhhh > Oh 
lantonieeeeee > Lantonie 
LANTOOO > Lantonie 
Lantööö > Lantonie 
(10) 
Normalisierung: Ist alles Konfetti bei euch ? 
Original: = alles konfetti bei euch ? 
(11) 
Normalisierung: Ich freue mich 
Original: _ * freu eS = 


Die Tokenabfolge des Originaltextes wird in der Normalisierung in keinem Fall 
geändert. Es werden lediglich Tokens eingefügt oder gelöscht. Dadurch bleibt 
z.B. die typische Verbletztstellung der Inflektive erhalten (siehe (12)). 


(12) 
Normalisierung: = erleichtert gucke = ich 
Original: * erleichtert] guck x = 


3.2 Syntaktische Annotation 


3.2.1 Wortartenannotation 


Die NoSta-D-Korpora werden mit dem STTS-Tagset (Schiller et al. 1999) anno- 
tiert. Wie in den tibrigen Annotationsschritten wird auch die Wortartenannota- 
tion des Originaltexts durch eine entsprechende Annotation der Normalisierung 
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motiviert. So wird beispielsweise das Wortartentag PPER für dudu in (13) aus 
der Normalisierung (du) übernommen. Eine Ausnahme wird bei Inflektiven 
gemacht: Diese erhalten in der Normalisierung das POS-Tag VVFIN, aber im 
Originaltext VVINF, wie in (14) gezeigt." 


(13) 

Normalisierung: Ja 5 das bist du 
Norm-POS: PTKANT $, PDS VAFIN PPER $. 
Original: jepp = = bist dudu = 
Orig-POS: PTKANT VAFIN PPER 

(14) 

Normalisierung: Ich mal gucke 3 wo Quaki sich nun 
Norm-POS: PPER ADV WFIN $, PWAV NE PRF ADV 
Original: _ mal guck u wo quaki sich nu 


Orig-POS: ADV VVINF PWAV NE PRF ADV 


3.2.2 Dependenzannotation 


Für die Annotation syntaktischer Strukturen sind sehr unterschiedliche Modelle 
entwickelt worden, die unterschiedliche Stärken und Schwächen mit sich brin- 
gen (vgl. Frank 2013). Für die Analyse von Nichtstandardsprache haben sich 
Dependenzmodelle allerdings als vorteilhaft herausgestellt (Kübler/Prokic 
2006; Nivre et al. 2007). Daher verwenden wir auch für das NoSta-D-Korpus ein 
Dependenzmodell. Für deutsche Zeitungssprache gibt es bereits sehr weit ent- 
wickelte automatische Dependenzparser mit einer hohen in-domain accuracy, 
also einer hohen Zuverlässigkeit für trainingsähnliche Daten (u.a. der MaltPar- 
ser von Nivre et al. 2007, der Stanford Parser von Rafferty/Manning 2008, der 
MATE Parser von Bohnet 2010). Die Modelle ziehen ihr „Wissen“ vor allem aus 


16 Das STTS wurde für konzeptionell schriftliche Sprache entwickelt und deckt viele Formen 
aus gesprochener Sprache, internetbasierter Kommunikation und anderen Varietäten nicht 
adäquat ab. Daher gibt es inzwischen Initiativen, die das STTS entsprechend erweitern wollen. 
Für Chat-Daten liegt dazu ein Vorschlag von Bartz/Beißwenger/Storrer (2014) vor. Da das 
NoSta-D-Korpus aber unterschiedliche Varietäten vergleichen will, wird hier nur das ursprüng- 
liche STTS angenommen. 
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statistischen Maßen, die zuvor in einer Trainingsphase aus annotierten (Zei- 
tungs)korpora extrahiert wurden. Für Out-of-domain-Daten müssen neue Trai- 
ningskorpora erstellt und die Modelle neu trainiert werden. Für unsere Nicht- 
standardvarietäten gibt es bisher keine adäquaten Trainingskorpora, so dass 
wir unsere Daten manuell annotieren müssen. 

Richtlinien für die manuelle Annotation von Dependenzen wurden zwar in 
Foth (2006) vorgeschlagen, diese Regeln decken aber selbst einen erheblichen 
Teil der in TüBa-D/Z vorhandenen sprachlichen Strukturen nicht befriedigend 
ab. Zwei andere für das Deutsche sehr viel umfassendere Richtlinien für die 
syntaktische Analyse sind Telljohann et al. (2005) für die TüBa-Baumbank und 
Albert et al. (2003) für das TIGER-Korpus. In beiden Fällen handelt es sich aller- 
dings um hybride Konstituentenstrukturbäume, für deren automatische Über- 
setzung in eine Dependenzstruktur zwar Werkzeuge entwickelt wurden (vgl. 
Forst et al. 2004, Seeker/Kuhn 2012), die aber menschlichen Annotatoren keine 
Entscheidungshilfe bei der Annotation von nichtkanonischen Daten bieten. 

Die Dependenz-Annotation des Originaltexts in NoSta-D wird, wie in den 
anderen Annotationsschritten, aus einer Dependenz-Annotation der Normali- 
sierung abgeleitet. Diese wiederum wird aus einer TIGER-Annotation der Nor- 
malisierung übersetzt”. Eine unmittelbare Dependenz- oder TIGER-Annotation 
des Originaltextes wäre aufgrund der Nichtkanonizität nicht konsequent durch- 
haltbar. So muss die Äußerung nur einsen (NoSta-D-unicum, Post 65) abhängig 
von der Normalisierung beispielsweise als Akkusativobjekt (15a) oder als Sub- 
jekt (15b) annotiert werden (gemäß den TIGER-Konventionen)”. 


(15a) (15b) 
© 
© = 


T [an a w 


Ich habe nur Einsen. Nur Einsen machen mich glücklich . 


Normalisierungsvariante für nur Normalisierungsvariante für nur einsen als Subjekt. 


einsen als Akkusativobjekt. 


17 Ausnahmen gibt es für Fälle, in denen TiGER vom STTS abweichende Wortartenannotatio- 
nen zugrunde legt (siehe das NoSta-D-Annotationsschema). 

18 NoSta-D enthält immer nur eine einzige Normalisierungsalternative. Das Beispiel (15) kann 
durch den Vorkontext (quaki: was hat denn zori??) zu (15a) desambiguiert werden. 
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Im Folgenden erklären wir die Übertragung der Annotation von der Normalisie- 
rung auf die Originaldaten. In vielen Fällen kann die Annotation der Normali- 
sierung 1:1 auf die Originaldaten übertragen werden, da die Originalsätze syn- 
taktisch nicht auffällig sind und vielleicht orthographisch und morphologisch, 
aber nicht syntaktisch normalisiert wurden. In Abschnitt 4.3 kommen wir auf 
diese Fälle unter der Bezeichnung parallele Annotationen zurück. In einigen 
Fällen kann die Annotation der Normalisierung nicht 1:1 auf die Originaldaten 
übertragen werden, weil nicht nur orthographisch und morphologisch, sondern 
auch syntaktisch normalisiert wurde. Ein Beispiel für eine solche abweichende 
Annotation findet sich in (15). Wie in Abschnitt 2 angesprochen, sind syntakti- 
sche Rollen wie Subjekt, Objekt oder (Verb)modifikator ohne Verb nicht zu- 
weisbar. In (16) sieht man, dass im Originaltext für Ich das Dependenzlabel 
SUBJ (Subjekt) aus der Normalisierung übernommen wird, die Dependenzkante 
aber nicht an ein Verb (es gibt ja keins), sondern an die Segmentwurzel” ge- 
bunden wird. 


(16) 


N 


OBA \ \ 
ur | } | 
Uy ý y y y 
Norm-POS: PPER | VAFIN PDS ADV ADV PTKNEG 
Norm: ich habe das mal wieder nicht 


(SUB) T MOD si 


y y y 


Orig-POS: PPER ADV ADV PTKNEG 
Orig: ich mal wieder nich 


Die in diesem Abschnitt dargestellte Vorverarbeitung und syntaktische Annota- 
tion erlaubt es, syntaktische Phänomene zwischen so unterschiedlichen Varie- 
täten wie Zeitungstexten, gesprochener Sprache und Plauderchats quantitativ 
zu vergleichen. In Abschnitt 4 werden wir Chat-Syntax daher nicht hauptsäch- 
lich anhand von Strukturen beschreiben, die nur in Chat zu finden sind (Emoti- 


19 Im Gegensatz zu allen anderen uns bekannten Dependenzschemata ist bei uns das finite 
Verb nicht der höchste Regent, sondern eine phonologisch wie auch graphematisch leere 
„Segmentwurzel“, an die realisierte finite Verben oder eben Dependenten von nicht realisier- 
ten Verben gebunden werden. 
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cons etc.), sondern mithilfe weiterer NoSta-D-Subkorpora die relativen Häufig- 
keiten syntaktischer Muster gegenüberstellen. 


4 Syntaktische Strukturen im NoSta-D Chat 


Die meisten der zahlreichen Artikel, die sich aus linguistischer Sicht mit Chat 
befassen, beschäftigen sich mit lexikalischen oder orthographischen Aspekten 
(so z.B. Myslin/Gries 2010), mit graphisch bzw. morphologisch auffalligen Ei- 
genschaften wie Emoticons ( :) ), Inflektiven (fasel) und Asterisk-Ausdriicken 
(*g*) (Teuber 1998) oder mit pragmatischen Phänomenen (vgl. dazu die Artikel 
in Herring/Stein/Virtanen 2013). Zur Syntax von Chats gibt es weniger Arbeiten. 
Allgemein wird oft angenommen, dass Plauderchats konzeptionell mündlich 
seien (vgl. Storrer 2001, 2013), ohne dass entsprechend zu erwartende mündli- 
che Eigenschaften in der Chat-Syntax nachgewiesen würden. 

Die erwähnten Emoticons, Inflektive und Asterisk-Ausdrücke lassen an- 
nehmen, dass die Syntax von Chats eher flach sei, denn diese Phänomene ver- 
halten sich offensichtlich asyntaktisch: Sie weisen wenig bis keine Kombinato- 
rik auf.” Dennoch greift die Annahme, Chat-Syntax sei konzeptionell mündlich 
(als Nähediskurs syntaktisch durch „Sparsamkeit“ charakterisiert, siehe 
Koch/Oesterreicher 1985:22), zu kurz: Einerseits gibt es in jedem Chat viele syn- 
taktisch vollständig kanonische Äußerungen, was auf konzeptionelle Schrift- 
lichkeit hinweisen könnte, und andererseits treten bestimmte Merkmale von 
Mündlichkeit (wie bspw. einige Typen von Unflüssigkeiten) gar nicht auf. 

Wir werden drei Aspekte der Chat-Syntax behandeln - nichtkanonische Zu- 
sammenschreibungen, syntaktische Komplexität und Unflüssigkeiten - und 
diese werden wir jeweils mit Daten aus dem NoSta-D-Subkorpus für gesproche- 
ne Sprache (NoSta-D-bematac) sowie mit Daten aus dem NoSta-D-Subkorpus für 
Zeitungssprache (NoSta-D-tuebadz) vergleichen. Wir möchten untersuchen, 
welche syntaktischen Aspekte in diesen drei Gebieten eher konzeptionell münd- 


20 Inflektive weisen zwar eine gewisse Kombinatorik auf, allerdings ist der syntaktische 
Status dieser „Inflektivkonstruktionen“ (Terminus von Schlobinski 2001) noch zu klären. 
Möglicherweise handelt es sich bei ihnen um morphologische Inkorporationen. Und selbst 
wenn man Inflektivkonstruktionen „holophrasalen“ (ebd.) Status zuweist, müsste man immer- 
hin noch erklären, warum sie (außer als direkte Rede und @-Beitrag) nicht eingebettet werden 
(können?), was mit finiten und auch infiniten Verben bzw. Sätzen gemacht werden kann und 
wird. 
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lich sind, welche eher schriftlich und wo Chat eigene syntaktische Eigenschaf- 
ten ausbildet”. 


4.1 Nichtkanonische Zusammenschreibungen 


Chatbeiträge unterscheiden sich in mehreren Punkten auffällig von anderen 
medial geschriebenen Varietäten. Finer davon ist die häufige Zusammenschrei- 
bung von Einheiten, die in ‚Standardsprache‘ getrennt geschrieben würden. In 
Anhang A findet sich eine Tabelle mit allen nichtkanonischen Zusammen- 
schreibungen in NoSta-D-unicum. Diese lassen sich in zwei große Gruppen 
unterscheiden: 

1. Zusammenschreibungen, die phonetisch motivierbar sind, 

2. Zusammenschreibungen, die nicht phonetisch motivierbar sind. 


Zusammenschreibungen in der zweiten Gruppe sind oft sogenannte Inflektive 
oder Bestandteile von Asterisk-Ausdrücken (wobei auch Inflektive oft, aber 
nicht immer, als Asterisk-Ausdruck geschrieben werden, wie in (17)). Diese 
kommen eigentlich nur in internetbasierter Kommunikation vor. Es stellt sich 
die Frage, ob es sich überhaupt um Klitisierung im Sinne der Verschmelzung 
syntaktisch selbstständiger Formen oder um morphologische Inkorporierung 
syntaktisch unselbstständiger Formen handelt (vgl. für eine Analyse der inter- 
nen Syntax von Inflektiven Schlobinski 2001). Die Zusammenschreibung in (18) 
ist zwar wie viele Inflektivkonstruktionen asterisk-markiert und subjektlos, 
doch statt der zu erwartenden inflektiven Verbform sei steht hier die flektierte 
Verbform bin. Auch hier stellt sich die Frage, welchen syntaktischen Status der 
Ausdruck haben kann. 


(17) 
Normalisierung: Die 2 Brust schwillt = mir 
Originaltext: as * brust| schwell g = = 


NoSta-D-unicum, Segment 66 


21 Alle Daten und Skripte für die Auszählungen sind in einem Paper-Package im Mind Rese- 
arch Repository hinterlegt: http://openscience.uni-leipzig.de/index.php/mr2/article/view/ 
125. 
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(18) 


Normalisierung: u fett bin _ ich 


Originaltext: 


* 
= 
oO 
= 

Flee as 
2. 
3 

+ 


NoSta-D-unicum, Segment 293 


Für uns ist unklar, ob Inflektive (außer beim Zitieren) jemals ausgesprochen 
werden. Die spontane Artikulation von Inflektiven und Inflektivkonstruktionen 
wäre aber eine nötige Evidenz, um über syntaktischen oder morphologischen 
Status der Inflektivkonstruktionen und damit auch über die syntaktische oder 
morphologische Motivierung ihrer Zusammenschreibung zu entscheiden. Viel 
allgemeiner aber noch wäre die spontane Artikulation von Inflektiven und In- 
flektivenkonstruktionen die Grundvoraussetzung dafür, diesen konzeptionell 
mündlichen Status zuweisen zu können (vgl. etwa Schlobinski (2001:208), der 
das koverte Subjekt von Inflektivkonstruktionen mit der Sprecher-(sic!)-Rolle 
gleichsetzt.). Was nicht ausgesprochen werden kann, kann nicht konzeptionell 
mündlich sein. Einzelfälle von Inflektivartikulationen reichen aber nicht aus, 
denn was im Mündlichen seltener vorkommt als im Schriftlichen, kann auch 
nicht konzeptionell mündlich sein”. 

Neben den Inflektiven, die für internetbasierte Kommunikation charakteris- 
tisch sind, findet man viele Fälle von nichtkanonischer, nicht phonetisch moti- 
vierter Zusammenschreibung, die mit einiger Berechtigung als „Fehler“ einge- 
stuft werden könnten (wie sichplauze, tombefreit, einemkuchen, [auf] jedenfall). 
Ob es sich dabei tatsächlich um Fehler handelt oder ob sich hier neue Regulari- 
täten etablieren, können wir aufgrund der geringen Datenmenge nicht sagen. 

Die nichtkanonischen Zusammenschreibungen, die wir phonetisch moti- 
vierbar genannt haben, sind für die Fragen nach konzeptioneller Mündlichkeit 
und linguistischen Annahmen der Sprecher interessant. Wenn wir davon aus- 
gehen, dass die Sprecher mit solchen Schreibungen Mündlichkeit nachahmen 
wollen, zeigen diese Schreibungen, welche phonologischen Wörter oder Kliti- 


22 Für Koch/Oesterreicher (1985:17) bestehen zwischen der Konzeption ‚gesprochen‘ und der 
Realisierung im phonischen Kode einerseits und der Realisierung im graphischen Kode ande- 
rerseits [eine] besondere „Affinität“ und „die Kombination, gesprochen + phonisch‘ [...] und, 
geschrieben + graphisch‘[...] [wird als] besonders typisch“ beschrieben. Dagegen zeigt Storrer 
(2014), dass die Dichotomie konzeptueller Mündlichkeit vs. Schriftlichkeit im Bereich der 
internetbasierten Kommunikation (IBK) an ihre Grenzen stößt, wo gerade nähesprachliche 
Elemente des interaktionsorientierten Schreibens nur noch mühsam überhaupt mündlich 
widergegeben werden können. 


64 — Dietterle/Lüdeling/Reznicek 


sierungen fiir sie salient sind (siehe ein Beispiel in (19a) und eine Liste weiterer 
solcher Schreibungen in (19b)). 


(19a) 


Normalisierung: So ein Bierbauch ist das ? 


Originaltext: so| n bierbauch 3 ? 


NoSta-D_unicum, Segment 286 


(19b) 

sparste, stimmts, weils, heisstes, kommste, issen, bisse, isses, hatter 
Die Zusammenschreibungen (19b) betreffen Elemente, die in der linken Satz- 
klammer stehen können (Verben oder Subjunktionen), und klitisierte unbetonte 
Pronomina. Man wird abwarten müssen, ob solche Fälle zu syntaktischem 
Wandel in der linken Satzperipherie führen. 


4.2 Syntaktische Komplexität 


Nachdem wir uns in Abschnitt 4.1 mit einer zwar graphisch auffälligen, aber nur 
bedingt syntaktischen Eigenschaft von Plauderchat-Sprache beschäftigt haben, 
wenden wir uns in diesem und dem folgenden Abschnitt genuin syntaktischen 
Merkmalen zu. Zunächst werden wir die Länge von Chat-Beiträgen und die Tiefe 
von Satzeinbettungen in Chat-Beiträgen ermitteln, denn diese geben Aufschluss 
über das „syntaktische Potenzial“. Je länger Sätze sind und je mehr Einbettun- 
gen sie haben, desto mehr komplexe Strukturen sind in ihnen zu erwarten. 

Dass Chat-Beiträge kürzer sind als Zeitungssätze oder Sätze in literarischer 
Prosa, dürfte wohl zu erwarten sein. Ob aber Chatbeiträge kürzer sind als Äuße- 
rungen in der gesprochenen Sprache, ist intuitiv weniger offensichtlich. Eine 
Auszählung der Segmentlängen (Tabelle 2) zeigt, dass die Segmente in NoSta-D- 
unicum im Vergleich zu den Segmenten in NoSta-D-bematac und NoSta-D- 
tuebadz signifikant kürzer sind (ca. 4 Tokens pro Segment)”. 


23 Man könnte einwenden, dass in den ca. 4,5-Token-langen Segmenten aus NoSta-D-bematac 
viele Selbstkorrekturen - also ‚eigentlich nicht gemeinte‘ und durch ‚eigentlich gemeinte“ 
überschriebene Tokens - enthalten sind, in den ca. 4-Token-langen Chatbeiträgen aber nicht 
(s. 3.3.1). Reduziert man die faktisch ausgesprochenen Äußerungen aus NoSta-D-bematac auf 
die ‚eigentlich gemeinten‘, dürfte der Längenvergleich zwischen NoSta-D-unicum und NoSta- 
D-bematac wohl anders ausfallen. Allerdings gehen wir davon aus, dass einige Unflüssigkeiten 
wie gefüllte Pausen und einige Selbskorrekturen integraler Bestandteil von gesprochener 
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In kürzeren Äußerungen — könnte man meinen - gibt es weniger komplexe 
syntaktische Strukturen, zum Beispiel weniger Satzeinbettungen. In NoSta-D- 
unicum und in NoSta-D-bematac sollte man also weniger und weniger tiefe 
Satzeinbettungen erwarten, als in NoSta-D-tuebadz. In NoSta-D-unicum sollte 
man zudem auch weniger und weniger tiefe Satzeinbettungen erwarten als in 
NoSta-D-bematac, weil die Segmente kürzer sind. 


Tab. 2: Segmentlängen im NoSta-D-Korpus. Der Längenunterschied von lediglich 0,44 Tokens 
pro Segment zwischen NoSta-D-unicum und NoSta-D-bematac ist aufgrund der Datenmenge 
(787 vs. 1791 Segmente) signifikant (pbinom=0,007). 


Subkorpus Segmente Original-Dependenten Segmentlänge 
(in Original-Dependenten) 


Xarithm oO 
NoSta-D-unicum 787 3.182 4,04 3,10 
NoSta-D-bematac 1.791 7.996 (7.508) 4,46 4,65 
NoSta-D-tuebadz 295 4.245 14,39 9,39 


Eine Auszählung der Satzeinbettungen zeigt, dass in NoSta-D-unicum und in 
NoSta-D-bematac Satzeinbettungen tatsächlich signifikant seltener und flacher 
sind als in NoSta-D-tuebadz. Jedoch zeigt die Auszählung nicht, dass in NoSta- 
D-unicum Satzeinbettungen signifikant seltener oder flacher sind als in NoSta- 
D-bematac. Im Gegenteil, die arithmetischen Mittelwerte in Tabelle 3 legen eine 
umgekehrte Tendenz nahe: in NoSta-D-unicum gibt es trotz kürzerer Beiträge 
mehr und tiefere Satzeinbettungen als in NoSta-D-bematac.™ 


Sprache sind und deswegen beim Segmentlängenvergleich unbedingt mit zu berücksichtigen 
sind (Eklund 2004, Belz 2013). Außerdem müsste man, wenn man schon nur die ‚eigentlich 
gemeinte‘ Segmentlänge berücksichtigen wollte, konsequenterweise auch alle nichtrealisier- 
ten, aber ‚mitgemeinten‘ Tokens (Ellipsen und andere Auslassungen) ergänzen, wodurch die 
Segmentlänge doch wieder länger werden würde. 

24 Ähnliche Ergebnisse für das Englische werden auf der Internetseite der University of Texas 
berichtet, nur dass der Längenunterschied zwischen Sätzen der Chatsprache und der gespro- 
chenen Sprache dort nicht formuliert wird und für die Komplexität der Chatsprache kein Kom- 
plexitätsmaß angegeben wird: http://coerll.utexas.edu/methods/modules/writing/01/cmc.php 
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Tab. 3: Satzeinbettungen in NoSta-D. 


Subkorpus Segmente Tiefe der Satzeinbettung 
1 2 3 4 
NoSta-D-unicum 787 46 2 0 0 
(=0,06 pro Segment) (=0,003 pro Segment) 
NoSta-D-bematac 1.791 88 4 0 0 
(=0,05 pro Segment) (=0,002 pro Segment) 
NoSta-D-tuebadz 295 93 15 5 1 


(=0,32 pro Segment) (=0,05 pro Segment) 


Nach den Merkmalen Segmentlänge und Einbettungstiefe ergibt sich eine klare 
Trennung zwischen NoSta-D-unicum und NoSta-D-bematac auf der einen Seite 
und NoSta-D-tuebadz auf der anderen. Daraus könnte man schließen, dass sich 
Chat-Sprache und gesprochene Sprache sehr ähneln. Betrachtet man aber ein 
weiteres syntaktisches Phänomen - die Parenthese -, ergibt sich ein anderes 
Bild. Parenthesen sind - ganz allgemein — Syntagmen, die linear in einem ande- 
ren Syntagma vorkommen, aber zu diesem in keiner syntaktischen Relation 
stehen. Parenthesen sind prinzipiell überall möglich, ihr Vorkommen zeugt 
nicht von syntaktischer Komplexität, sondern von Einfachheit. Tabelle 4 zeigt, 
dass es sehr viele Parenthesen in NoSta-D-bematac, aber kaum welche in NoSta- 
D-unicum gibt. Die Syntax in NoSta-D-unicum ist also integrierter, die Syntag- 
men seltener durch Uneingebettetes unterbrochen. 


Tab. 4: Parenthesen im NoSta-D-Korpus. 


Subkorpus PAR-Dependenz Dependenzen insgesamt 
Ja Nein 

NoSta-D-unicum 2 3.180 3.182 

NoSta-D-bematac 21 7.975 7.996 


NoSta-D-tuebadz 12 4.233 4.245 
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4.3 Syntaktische Wohlgeformtheit 


Nachdem wir in Abschnitt 4.1 mit den nichtkanonischen Zusammenschreibun- 
gen ein Phänomen von Plauderchat-Sprache besprochen hatten, das unmittel- 
bar am Originaltext - auch ohne Vergleich mit anderen Varietäten oder mit 
einer Normalisierung — zugänglich und als Chat-Spezifikum erkennbar ist, ha- 
ben wir in Abschnitt 4.2 Eigenschaften von Chat-Sprache besprochen, die erst 
im Vergleich mit anderen Varietäten zugänglich und als chat-spezifische Vertei- 
lungen von auch in anderen Varietäten vorkommenden syntaktischen Phäno- 
menen erkennbar werden. Ein Vergleich mit einer Normalisierung des Original- 
texts war auch dafür noch nicht notwendig. In Abschnitt 4.3 wollen wir nun 
zwei syntaktische Phänomene besprechen, die prinzipiell nur durch einen Ver- 
gleich mit einer Normalisierung zugänglich werden und deren chat-spezifische 
Verteilung nur im Vergleich mit anderen Varietäten erkennbar wird — Phäno- 
mene also, deren Erforschung erst dank des NoSta-D-Korpus möglich geworden 
ist. 


4.3.1 Selbstkorrekturen und Wiederholungen 


Die Annahme, Chat-Syntax sei wie gesprochene Syntax, impliziert auch, dass 
Chat-Syntax ebenso wie gesprochene Syntax einen ausgeprägten „online“- 
Charakter haben sollte (vgl. Auer 2000). Gesprochene Sprache entsteht spontan 
und enthält viele Selbstkorrekturen und Wiederholungen, in denen ein Spre- 
cher einmal geäußerte Wörter oder Syntagmen durch andere ersetzt bzw. in 
denen ein Sprecher Silben, Wörter und Syntagmen wiederholt, um eine bereits 
angedeutete Selbstkorrektur zurückzunehmen oder das Parsing einer komple- 
xen Struktur zu erleichtern (vgl. z. B. Belz 2013). An der Spontaneität der Chat- 
Beiträge ist nicht zu zweifeln. Sie entstehen in schneller Abfolge. Mitunter kann 
die am Absendezeitpunkt festgemachte chronologische Abfolge der Beiträge 
sogar ihre inhaltliche Abfolge überholen: Chat-Teilnehmer setzen ihre Beitrags- 
sequenzen bereits fort, während andere noch Antworten auf frühere Beiträge 
tippen (vgl. Storrer 2001:3f.). Dieses Verhalten führt dazu, dass ganze Chat- 
Beiträge wiederholt und gegebenenfalls korrigiert werden müssen, wie Beispiel 
(20) zeigt. 
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(20) 


Segment Chat-Teilnehmer Chat-Beitrag 


128 Quaki „und wo is ein apfel für mich??“ 

146 Zora „zora bewirbt sich damit mal um stipendien an den unis“ 
154 Emon „zora bewirbt sich womit um stipendien?“ 

155 Emon „nen apfel?“ 

157 Zora „ne mit meinem zeugniss, ich bin ja nich doof!“ 


Selbstkorrekturen und Wiederholungen sind in NoSta-D durch eine 
COR(rection)-Kante annotiert. Um die ursprünglich zu erfüllende syntaktische 
Funktion nicht zu verlieren, wurde „COR“ als Kreuzkategorie eingeführt, die 
der syntaktischen Kategorie vorangestellt wird. Im Beispiel (21) hat sich der 
Sprecher zuerst korrigiert („aus der“ > „aus dem“) und dann wiederholt („aus 
dem“ > „aus dem Fünfunddreißiggradwinkel“). Die endgültige Dependenz ist 
eine MOD(ification), die beiden Vorgängervarianten sind daher COR(rec- 
ted)MOD(ifications). 

Eine genaue Unterscheidung von Selbstkorrekturen und Wiederholungen 
und eine dadurch motivierte unterschiedliche Dependenzannotation derselben 
wurde im NoSta-D-Korpus nicht vorgenommen. Es wäre eine äußerst diffizile 
und im Grunde auch keine syntaktische Unterscheidung, sondern eine pragma- 
tische. Das syntaktisch Gemeinsame von Selbstkorrekturen und Wiederholun- 
gen, womit die einheitliche Dependenzannotation derselben in NoSta-D moti- 
viert wird, ist der durch sie bedingte Überschuss an syntaktischer Struktur: 
Selbstkorrekturen sind ein „Zuviel“ an Struktur, Wiederholungen ebenfalls. 

Ein Hörer bzw. Leser muss erkennen, dass nicht alle Teile einer Äußerung 
tatsächlich gemeint sind, sondern dass er bestimmte vorangehende, korrigierte 
bzw. Erstvorkommen von Wörtern/Syntagmen von der Interpretation aus- 
schließen und nur nachfolgende, korrigierende bzw. wiederholte Vorkommen 
in die Interpretation einschließen soll. Darin, dass sie nur partiell (in ihrer je- 
weils letzten Instanziierung) zu interpretieren sind, unterscheiden sich Selbst- 
korrekturen und Wiederholungen fundamental von anderen Reihungen wie 
Koordination (dann rechts, dann links, dann gradeaus) und Framing (hier, oben, 
bei dem Bild, so links davon, genau da), die holistisch zu interpretieren sind. 
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Eine Auszählung der Selbstkorrekturen und Wiederholungen (Tabelle 5) 
zeigt, dass sich Chat-Teilnehmer innerhalb von Posts nicht selbst korrigieren 
und wiederholen, was aber durchaus typisch für gesprochene Sprache ist, vgl. 
Beispiel (21) aus NoSta-D-bematac. 


21) 


MOD 


PN 


Also gehst du aus der aus dem aus dem Fünfunddreißiggradwinkel 


NoSta-D_bematac_2011-12-14-B, Segment 77 


Tab. 5: COR-kreuzgelabelte Dependenzen in NoSta-D. Ein COR-Label wird vergeben für korri- 
gierte Dependenten oder Erstvorkommen von wiederholten Elementen. 


Subkorpus COR-Dependenz Dependenzen insgesamt 
NoSta-D-unicum 0 3.182 
NoSta-D-bematac 139 7.996 
NoSta-D-tuebadz 0 4.245 


Die Sprache in NoSta-D-unicum erscheint auf der Ebene der Posts also „edi- 
tiert“, insofern dass die Chat-Teilnehmer syntaktisch wohlgeformte(re) Posts 
abschicken, ohne Selbstkorrekturen und Wiederholungen. Auf Diskurs-Ebene 
erscheint die Sprache in NoSta-D-unicum allerdings nicht editiert, insofern dass 
die entstehenden Texte nicht kohärent sind. Die Beitragsabfolge weicht von der 
inhaltlichen Abfolge ab, ohne dass dafür die sonst in der Schriftsprache vor- 
handenen kohärenzsichernden Mittel genutzt werden (vgl. dazu auch Beiß- 
wenger 2007, 2016). Erstere Eigenschaft markiert Chat-Sprache als „nicht münd- 
lich“, die zweite Eigenschaft hingegen als „mündlich“, denn auch in 
mündlichen Gruppengesprächen wird gleichzeitig gesprochen, gegenseitig 
unterbrochen, spontan das Thema gewechselt, zum vorherigen Thema zurück- 
gekehrt usw. 
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4.3.2 Fragmente 


Wahrend uns im Abschnitt 4.3.1 die syntaktische Wohlgeformtheit im Sinne der 
Abwesenheit überschüssiger syntaktischer Struktur interessierte („nicht zu viel 
Struktur“), kommen wir in diesem Abschnitt nun zur syntaktischen Wohlge- 
formtheit im komplementären Sinne, also im Sinne der Abwesenheit fehlender 
syntaktischer Struktur („nicht zu wenig Struktur“). 

Fehlende syntaktische Struktur ist in der Linguistik unter Bezeichnungen 
wie Ellipse, Auslassung, Abbrüche bekannt. Es handelt sich um oberflächlich 
nicht realisierte, aber mitgemeinte und potentiell realisierbare Elemente - ganz 
im Gegensatz zu den realisierten, aber nicht mitgemeinten Elementen in Selbst- 
korrekturen und Wiederholungen.” Was genau nicht realisiert, aber mitgemeint 
ist, wird aus dem sprachlichen oder außersprachlichen Kontext hergeleitet. 

Zahlreiche Studien beschäftigen sich damit, fehlende syntaktische Struktu- 

ren nach Art und Umfang des jeweils zur Identifizierung heranzuziehenden 
Kontexts zu klassifizieren (für einen Überblick vgl. z.B. Reich 2011). Wir kennen 
allerdings keine Studien, die sich spezifisch mit dem sprachlichen Material 
beschäftigen, das in elliptischen Strukturen realisiert wurde. Wir wählen hierfür 
die Bezeichnung „Fragmente“. In NoSta-D unterscheiden wir zwei Typen von 
Fragmenten. Sie können selbst als oberstes Element unter der Segmentwurzel 
auftauchen (siehe (16)) oder sie können indirekter Dependent eines Elementes 
sein, deren vermittelndes Element selbst ausgelassen wurde (siehe (22)). In 
diesem Fall trägt die Kante die Kreuzkategorie „X“ sowie die Kategorie der Kan- 
te von Mutterknoten zum ausgelassenen Element. 
Im NoSta-D-Korpus können wir die objektsprachlichen Fragmente und die nicht 
objektsprachlichen Ellipsen/Auslassungen - diese werden ja nur vom Hö- 
rer/Leser bzw. Linguisten hinzugedacht - daher sauber trennen: Fragmente 
stehen unverändert im Originaltext und „fehlende“ syntaktische Strukturen 
werden in der Normalisierung aufgefüllt. Ein Vergleich des Originaltexts mit der 
Normalisierung ermöglicht nun auch eine qualitative Auswertung der Fragmen- 
te (neben der weiterhin möglichen Auswertung der Ellipsen, Auslassungen 
etc.). 


25 Als „Null-Elemente“ werden demgegenüber eher Elemente verstanden, die nicht realisiert 
und potentiell auch gar nicht realisierbar, aber dennoch mitgemeint sind, z.B. Null-Subjekte in 
Infinitivsätzen mit zu. 
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(22) 
7° IBJ 
Norm: verstehst du was ich meine 
XOBJC 
XOBJC 
SUBJ 
Orig: verstehst du was ich 


NoSta-D_bematac_2011-12-14-B, Segment 175 


Eine Auszählung der Fragmente im NoSta-D-Korpus (Tabelle 6) zeigt, dass sich 
die Fragmente in NoSta-D-unicum qualitativ von den Fragmenten in NoSta-D- 
bematac unterscheiden. In (dependenzfähigen*) Token gezählt gibt es in bei- 
den Subkorpora ungefähr gleich viel fragmentarisches Material, denn in beiden 
Subkorpora mussten gleich viele (dependenzfähige) Token hinzunormalisiert 
werden, um kanonische Texte zu erhalten. Das fragmentarische Material in 
NoSta-D-unicum verteilt sich aber im Gegensatz zu NoSta-D-bematac auf eine 
kleinere Anzahl von Fragmenten, die intern parallel zur Normalisierung, aber 
nach außen hin abweichend von der Normalisierung annotiert werden. Zudem 
befinden sich die Fragmente in NoSta-D-unicum häufiger unten im Dependenz- 
graphen und die „fehlenden“ syntaktischen Strukturen oben - mit der Konse- 
quenz, dass die Fragmente selbst an die Segmentwurzel gebunden werden - 
während die Fragmente in NoSta-D-bematac häufiger diffus im Dependenzgra- 
phen verteilt und mit fehlenden syntaktischen Strukturen verzahnt sind.” 


26 Alle Knoten außer den Segmentwurzelknoten. 

27 Einer gesonderten Betrachtung bedürfen Fragmente unterhalb von Konjunktionen und 
Verba dicendi, auf welche hier aus Platzgründen verzichtet wird. Das hier Dargestellte ist 
davon jedoch nicht betroffen. 
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Tab. 6: Fragmente in NoSta-D. 


Subkorpus Org.Text- zus. Norm.- von Norm. abweichende Kanten 
Dependen- Dependenten (= Regenten (!) von Fragmenten) 
ten (zaufgefüllte Ellip- 
sen/ Auslassun- gesamt an Segment- X-Dependenz 
gen) Wurzel (siehe 23) 
(siehe 22) 
NoSta-D- 3.182 461 (=14%) 248 202 16 
unicum 
NoSta-D- 7.996 1.142 (=14%) 1336 699 178 
bematac 
NoSta-D- 4.245 122 (=3%) 202 60 27 
tuebadz 


Beispiel (23) zeigt ein für NoSta-D-unicum typischeres Fragment. Beispiel (24) 
zeigt ein für NoSta-D-bematac typischeres Fragment. 

Fragmente in NoSta-D-unicum sind innerhalb eines Segments eher depen- 
dentiell gleichwertig - sie sind gleichermaßen Dependenten von nichtrealisier- 
ten Regenten, nicht Dependenten voneinander. Die Fragmente in NoSta-D- 
bematac hingegen sind innerhalb eines Segments eher nicht dependentiell 
gleichwertig — die einen Fragmente sind (mittelbare) Dependenten der anderen 
Fragmente. 

Auch hier sehen wir wieder, dass sich NoSta-D-unicum und NoSta-D- 
bematac, die beide auf den ersten Blick ähnlich scheinen, sich im Detail in inte- 
ressanter Weise unterscheiden. Die Fragmente in NoSta-D-unicum sind zwar 
häufig kein Sätze, aber immerhin wohlgeformte Konstituenten. Die Fragmente 
in NoSta-D-bematac dagegen sind oft weder Sätze noch wohlgeformte Konsti- 
tuenten. 


(23) 
ORIG: SUBJ 


Quelle: NoSta-D-unicum, Segment 3 
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(24) 
ORIG: 
\ 
B a mes ak ap Tamm. Sean esd. Da a hk c= S A 
s \ 
2 u ine Dans an a Samen „a avd cach wag: Gas ma i a ai ET 
Quelle: NoSta-D-bematac_2011-12-14-B, Segment 178 


5 Zusammenfassung 


In diesem Beitrag haben wir einen Weg aufgezeigt, wie man syntaktische Struk- 
turen in Plauderchat-Daten beschreiben und mit analogen Strukturen in ande- 
ren Varietäten qualitativ und quantitativ vergleichen kann. Wir haben anhand 
des NoSta-D-Korpus gezeigt, dass eine konsistente, gut beschriebene Normali- 
sierung Vergleiche auf mehreren sprachlichen Ebenen zulässt. Zu diesem Zweck 
haben wir einen Plauderchat analysiert und mit gesprochenen MapTask-Daten 
und mit Zeitungsdaten verglichen. 

Bisher werden Chats nur selten varietätenlinguistisch verglichen (für ein 
Beispiel vgl. Bittner 2003). Weil Chats interaktional ablaufen, wird oft ange- 
nommen, dass sie auch sprachlich konzeptuell vor allem mündlich seien. Als 
Evidenz dafür wird angeführt, dass es nichtkanonische Zusammenschreibun- 
gen gibt und die Beiträge eher kurz und nicht komplex seien. Plauderchats wer- 
den nicht detailliert mit Gesprächen oder auch mit anderen schriftlichen Daten 
verglichen. In unserem Beitrag haben wir gezeigt, dass diese Plauderchatdaten 
auf den ersten Blick tatsächlich aussehen wie Gesprächsdaten und dass sich 
beide Varietäten von konzeptionell geschriebenen Daten unterscheiden. Bei 
genauerem Hinsehen ist das Bild komplexer. Nur einige der nichtkanonischen 
Zusammenschreibungen ahmen phonetische Klitisierungen nach. Andere fol- 
gen ganz eigenen Regeln. Chatbeiträge sind kürzer als Beiträge in Gesprächen, 
aber syntaktisch etwas integrierter. Im Unterschied zu Gesprächen finden wir in 
Chatdaten kaum Parenthesen. Chatdaten und gesprochene Daten enthalten 
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viele Fragmente, im Detail unterscheiden sich diese aber: Chatfragmente sind 
meist kanonische Phrasen, während gesprochene Fragmente oft nicht einmal 
Phrasen bilden. 

Wie die unterschiedlichen Subkorpora des DCK deutlich machen, unter- 
scheiden sich Chats erheblich voneinander. Es wäre daher nötig, zu überprüfen, 
welche unserer Befunde sich auf Chats aus unterschiedlichen Bereichen und 
von unterschiedlichen Teilnehmern (z.B. aus anderen sozio-ökonomischen 
Schichten) replizieren lassen, bevor generellere Aussagen über ‚Sprache in 
Chats‘ gemacht werden können. Ohne eine gute Datengrundlage kann man 
keine Untersuchungen zu den möglichen Einflüssen wie Medium, Gleichzeitig- 
keit, Anonymität etc. auf syntaktische Strukturen machen. 
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7 Anhang 


7.1 Anhang A 


Tokens 


„erleichert| guck“ 
„[wat] fiir| n“ 
„brust| schwell“ 


„[eine] Zeit| lang“ 


„stimmt| s“ 
„so| ne“ 


„[auf] jeden] fall“ 


„Nal gut| 50| cm| Lauflaufleine“ 
„51| cm“ 

»neue| such“ 

„k| A“ 


„so| was“ 


„[auf] jeden| fall“ 

„so| was“ 

„weill s“ 

„wär| s“ 

„heisst| es [... @ ...]“ 
„an| ne [Stirm]“ 
„laber wie] kommst| e“ 
„[nennt] sich| plauze“ 
„kommst| e“ 

„so|n“ 

„kopf] kratz“ 

„fett| bin“ 

„korsett| such“ 

„so| was“ 

„sparst| e“ 

,augen| reib“ 


„zwickizwacki| marc30| quaki“ 


In Asterisk-Ausdruck? 


nein 


Phonetisch motivierbar? 


nein 

ja 

nein 

nein, aber nach alter Recht- 
schreibung erlaubt 

ja 

ja 

nein (allerdings feste Phra- 

se) 

nein 

nein 

nein 

nein 

ja (und auch orthographisch 
möglich) 


nein 
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Tokens In Asterisk-Ausdruck? Phonetisch motivierbar? 


„auf| n [baum]“ nein ja 
»hinterher| kann“ 


„So| n“ nein ja 
„[wat] für| n“ nein Ja 
„iss| en“ nein ja 
„kopf] kratz“ ja nein 
„bis| se“ nein ja 
„[is] tom] befreit nein nein 
„so| was“ nein ja 
„auf| m [baum]“ nein ja 
»gegen| den| chat| und] emine| ja nein 


compil tret“ 


„empört| guck“ ja nein 
»macht| s“ nein ja 
»wink| und| weg“ nein nein 
„[hab] ich| s“ nein ja 
„macht| es“ nein ja 
„einem| kuchen“ nein nein 
„zunge]| raushäng“ ja nein 
„skeptisch| zuhör“ ja nein 
„iss| es“ nein ja 
„Lena| anschau“ ja nein 
»wiink| und| wech“ nein nein 
„hatt| er“ nein ja 
„hab| s [... gesehen]“ nein ja 


Alle nichtkanonischen Zusammenschreibungen in NoSta-D mit einer Einschät- 
zung über ihre Motiviertheit. 
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7.2 Anhang B 


Syntaktische Darstellung der beiden Satzeinbettungen zweiten Grades in NoSta- 
D-unicum. 


ORIG: 


NoSta-D-unicum, Segment 92 


__NEB KOSUBJ OBJ: 


ORIG: 


NoSta-D-unicum, Segment 614 


Wolfgang Imo 

Interaktionale Linguistik und die qualitative 
Erforschung computervermittelter 
Kommunikation 


1 Einleitung 


In diesem Beitrag steht die qualitative Analyse von computervermittelter inter- 
aktionaler Kommunikation im Vordergrund. Unter interaktionaler Kommunika- 
tion wird dabei in Anlehnung an die Definition in Imo (2013: 55-58 sowie 2016b) 
Kommunikation gefasst, bei der ein hohes Maß an Situationsgebundenheit 
sowie eine kollaborativ erzeugte sequenzielle Struktur vorliegt. Die Situations- 
gebundenheit ist dabei dadurch definiert, dass Sprache sich über eine Serie von 
„ongoing practical accomplishements“ (Psathas 1995: 3) entfaltet, wodurch die 
Situation selbst ständig neu definiert wird und die Verantwortung für die Her- 
stellung von Bedeutung nicht bei einem einzelnen Akteur liegt, sondern „rather 
with the interactional past, current, and projected next moment“ des von den 
Akteuren gemeinsam produzierten sprachlichen Austauschs. Durch das Erfor- 
dernis, dass die Bedeutungen und Situationsdefinitionen von allen an der In- 
teraktion Beteiligten fortlaufend (re)definiert werden müssen, werden ‚weite‘ 
Dialoge im Sinne beispielsweise Bachtins (1979, 1996), zu denen z.B. auch ein 
Kommentar zu einem Werk von Goethe gerechnet werden kann, ausgeschlos- 
sen, während ‚enge‘ Dialoge wie die Kommunikation über E-Mail oder SMS als 
interaktional gefasst werden können. 

Der zweite wichtige Aspekt interaktionaler Kommunikation ist die markante 
sequenzielle Struktur, die für Phänomene von „order/organization/orderliness 
of social action“ (Psathas 1995: 2) maßgeblich verantwortlich ist: „In talk-in- 
interaction each utterance displays a hearing or analysis of a preceding one 
and, thus, the very organization of talk provides a means by which intersubjec- 
tive understanding can not only be continually demonstrated but also checked, 
and, where found wanting, repaired.” (Sidnell 2010: 12) Dies gilt nicht nur für 
die von Sidnell hier angesprochene medial mündliche, sondern auch für schrift- 
liche Interaktion, sofern ein kontinuierliches ‚Monitoring‘ der Äußerungen der 
Gesprächspartner und ein ständiges lokal ausgehandeltes Anpassen der Äuße- 
rungen nach den Erfordernissen der Vorgängeräußerungen gegeben sind. 


DOI 10.1515/9783110567786 
@Open Access © 2020 Wolfgang Imo, publiziert von Walter de Gruyter GmbH. [> Da 


Dieses Werk ist lizenziert unter der Creative Commons Attribution 4.0 Lizenz. 


82 — Imo 


Mit dieser Definition von Interaktion kann nun dafür plädiert werden, bei 
solchen Kommunikationsformen, bei denen „quasi-synchron“ (Dürscheid 2003) 
kommuniziert wird bzw. werden kann - wie bei der SMS-Kommunikation, bei E- 
Mails oder beim Chat - mit einem Instrumentarium an die Analyse zu gehen, 
das speziell dafür entwickelt wurde, Prozesse der gemeinsamen Bedeutungs- 
aushandlung, der sequenziellen Organisation und der Herstellung und Auf- 
rechterhaltung von Intersubjektivität im Sinne Schegloffs (1992) zu beschreiben, 
denn diese Prozesse sind in den genannten Kommunikationsformen zentral. So 
schreiben Dürscheid/Brommer (2009: 16), dass „das Online-Schreiben und das 
Schreiben am Handy auch in der Schriftlichkeit ein unmittelbares, interaktives 
Handeln“ ermöglichen, sofern „die Beiträge quasi-synchron aufeinander fol- 
gen“. 

Es bietet sich daher an, auf Konzepte wie die Konversationsanalyse (bzw. 
Gesprächsanalyse) sowie die Interaktionale Linguistik zu rekurrieren, die beide 
ursprünglich für die Analyse medial und konzeptionell mündlicher Sprache 
entwickelt wurden und bei denen die Sequenzanalyse im Mittelpunkt steht und 
das Interesse auf der Beschreibung der Ko-Produktion von Sinn durch die Inter- 
agierenden liegt (vgl. Bergmann 1981, Deppermann 2001, 2007, 2014, Gül- 
ich/Mondada 2008, Imo 2013: 71-76, Levinson 2000: 309-416 und Schegloff 
1990, 2007 zum Vorgehen der Gesprächsanalyse und Barth-Weingarten 2008, 
Couper-Kuhlen/Selting 2000, 2001a, b und Imo 2013: 77-83, 2104 zu dem der 
Interaktionalen Linguistik). Der Vorteil der Interaktionalen Linguistik sei, so 
Dürscheid/Brommer (2009: 17), dass man damit gerade auch die „kommunika- 
tiv-situativen Aspekte“ von interaktionaler schriftlicher Kommunikation analy- 
sieren könne: „Will man der Dynamik getippter Dialoge gerecht werden, dann 
genügt es nicht, Äußerungsformen dieser Art im Rahmen des Modells von 
Koch/Oesterreicher (1994) zu betrachten. Fin Forschungsansatz, der sich als 
geeigneter erweist, ist die Interaktionale Linguistik.“ 

Im Folgenden soll nun zunächst der Ansatz der Interaktionalen Linguistik 
dargestellt werden, danach werden einige exemplarische interaktional- 
linguistische Untersuchungen zur computervermittelten Kommunikation vorge- 
stellt und zum Schluss gezeigt, welche Vorteile - aber auch welche Nachteile - 
dieses Vorgehen bei der Analyse computervermittelter Kommunikation hat. 
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2 Theorie und Methode der Interaktionalen 
Linguistik 


2.1 Die theoretischen Annahmen der Interaktionalen 
Linguistik 


Was die theoretischen Grundannahmen angeht, so lassen sich diese aus einer 
vorab erfolgten Setzung der Interaktionalen Linguistik ableiten, die darin be- 
steht, dass der Hauptzweck interaktionaler Sprache - und damit auch ihre 
Struktur - darauf ausgelegt ist, intersubjektiv Bedeutung herzustellen und sozi- 
ale Beziehungen zu gestalten (eine ausführliche Darstellung des Ansatzes findet 
sich in Imo 2014 und 2016b). Linell (2005: 21) fasst diese Grundannahme wie 
folgt zusammen: „Interactional, spoken language is designed to cope with 
meaning-making in specific situations, and in real time and space. It has its 
home base in talk-in-interaction, which is a complex social interplay between 
actors.” Damit unterscheidet sich die Interaktionale Linguistik von anderen 
linguistischen Ansätzen, in denen beispielsweise eher Konzepte wie die Infor- 
mationsübermittlung (z.B. Rickheit/Strohner 1993) oder die Sprecherintention - 
wie in der funktionalen Pragmatik (z.B. Ehlich 1996; 2006) oder der Dialogana- 
lyse (z.B. Hundsnurscher 1994, 2001 bzw. Weigand 1994, 2000) - im Mittelpunkt 
stehen, aber auch von Ansätzen wie der Interaktionslinguistik (Hausendorf 
2015), die explizit ihren Gegenstand auf die Analyse auf die Face-to-face- 
Interaktion einengen. Akzeptiert man die Hypothese, dass Sprache-in- 
Interaktion primär auf die Gestaltung der Beziehung zwischen Interagierenden 
und die gemeinsamen Herstellung von Sinn ausgerichtet ist, so ergeben sich 
daraus insgesamt vier Prinzipien: Die Reflexivität zwischen Sprache und Kon- 
text als ein übergeordnetes Prinzip, die Sequenzialität als strukturierendes 
Merkmal von Sprache-in-Interaktion, das kollaborative Erzeugen von Struktur 
und Bedeutung und schließlich die unaufhebbare Einbettung von Sprache in 
Kontexten (vgl. zu einer Diskussion der vier Prinzipien Linell 1998: 84-86 und 
Imo 2013: 60-70). Das erste Prinzip wird von Linell (1998: 84) wie folgt definiert: 
“Reflexivity between discourse and contexts: Reflexivity means that two orders 
of phenomena are intrinsically related, so that one of them is conceptually im- 
plicated by the other, and vice versa.” Das bedeutet, dass beispielsweise die 
Wahl einer bestimmten kommunikativen Gattung (vgl. Günthner 1995, 2006, 
Günthner/Knoblauch 1994, 1995, 1996, 1997 und Luckmann 1986, 1988, 1992 
zum Konzept der kommunikativen Gattungen) die Wahl bestimmter sprachli- 
cher Mittel erwartbar macht, umgekehrt aber genau diese sprachlichen Mittel 
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erst die Wahl der Gattung indizieren. So macht eine scherzhafte Interaktions- 
modalität beispielsweise den Einsatz von Emoticons in der computervermittel- 
ten Kommunikation erwartbar, während wiederum genau der Einsatz von Emo- 
ticons die scherzhafte Interaktionsmodalität indiziert (vgl. Imo 2015a). Eine 
solche Verschränkung von kontextuellen Phänomenen und Sprache ist nur 
über detaillierte, qualitative Untersuchungen herauszufinden. 

Ein weiteres Prinzip interaktionaler Sprache besteht in deren Sequenziali- 
tät. Sprache-in-Interaktion „has a fundamental sequential organization. Each 
constituent action, contribution or sequence gets significant parts of its mean- 
ing from the position in a sequence” (Linell 1998: 85). Auch hier sind so viele 
Details wie möglich berücksichtigende, qualitative Untersuchungen notwendig, 
um rekonstruieren zu können, wie Äußerungen aufeinander Bezug nehmen und 
welche Regularitaten sich dabei zeigen. Gerade im Bereich der Sequenzialität ist 
eine Reduktion auf einzelne, aus dem Kontext losgelöste Äußerungen, wie sie in 
quantitativen Untersuchungen häufig vorkommt, fatal, denn „one can never 
fully understand an utterance or an extract, if it is taken out of the sequence 
which provides its context” (Linell 1998: 85). Die prozessuale Entwicklung so- 
wohl von sprachlicher Struktur als auch von Bedeutung lässt sich nur über den 
sequenziellen Ablauf rekonstruieren. 

Das dritte Prinzip hängt eng mit dem der Sequenzialität zusammen. Spra- 
che ist ein soziales Phänomen, und das bedeutet, dass ein Dialog — ganz gleich 
ob medial schriftlich oder mündlich geführt - eine „joint construction“ dar- 
stellt, die nicht einem der Interagierenden allein zugeschrieben werden kann, 
sondern von der Kooperation aller Interagierenden abhängt: “This collective 
construction is made possible by the reciprocally and mutually coordinated 
actions and interactions by different actors. No part is entirely one single indi- 
vidual’s product or experience.” (Linell 1998: 86) Ein Vorwurf oder ein Witz 
beispielsweise wird erst durch die Ratifizierung als Vorwurf oder Witz von Sei- 
ten der Interaktionspartner zu einer beobachtbaren und empirisch analysierba- 
ren Handlung. Als Handlung eines einzelnen Produzenten ohne reaktiven Be- 
zug durch einen Rezipienten sind solche Aktivitäten aus interaktionaler 
Analyseperspektive nicht von Belang, da für die Analyse stets die Aufzeigeprak- 
tiken der Beteiligten als Analysekategorien herangezogen werden müssen. 

Das letzte Prinzip besteht in der Verschränkung von größeren Aktivitäten 
(„kommunikativen Projekten“; Linell 2012, Fiehler 2000) und einzelnen Hand- 
lungen. Handlungen beziehen einen großen Teil ihres Sinns aus der Tatsache, 
dass sie in bestimmten Situationen, im Kontext bestimmter kommunikativer 
Projekte oder kommunikativer Gattungen geäußert werden. Auch hier gilt, dass 
eine Beschränkung auf einzelne Äußerungen kein klares Bild über deren Funk- 
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tion geben kann: „Acts, utterances and sequences in discourse are always es- 
sentially situated within an embedding activity (dialogue, encounter) which the 
interactants jointly produce.” (Linell 1998: 86) 

Aus diesen sehr allgemeinen Grundprinzipien leitet die Interaktionale Lin- 
guistik — die wissenschaftsgeschichtlich aus der Konversationsanalyse entstan- 
den ist — nun ihre Definition von Sprache ab. Sprache und Grammatik werden 
dabei nicht als abstrakte Systeme (im Sinne einer langue) konzeptualisiert, son- 
dern sie sind zugleich die Grundlage und das Ergebnis von Interaktion, wie 
Schegloff/Ochs/Thompson (1996: 38) betonen: 


[Glrammar is not only a resource for interaction and not only an outcome of interaction, it 
is part of the essence of interaction itself. Or, to put it another way, grammar is inherently 
interactional. In this perspective, grammar is imbued with subjectivity and sociability: 
grammar is viewed as lived behavior, whose form and meaning unfold in experienced in- 
teractional and historical time. 


Bei Schegloff handelt es sich um den Mitbegründer der Konversationsanalyse 
(Sacks/Schegloff 1973; Sacks/Schegloff/Jefferson 1974, 1977; Schegloff 1968, 
1979, 1986, 1990, 2007). Der konversationsanalytische Standpunkt besagt, dass 
sprachliche Strukturen aus der Interaktion heraus entstehen und dort flexibel 
angepasst und verändert werden können bzw. dass die sprachlichen Muster, die 
wir für vermeintlich stabile Phänomene eines sprachlichen Systems halten, 
diesen Status auf Grund ihrer häufigen Verwendung und der daraus resultie- 
renden entsprechend hohen Routiniertheit erhalten. Während allerdings die 
Konversationsanalyse nur wenig Interesse speziell an der Grammatik einer 
Sprache hat und stattdessen - als genuin soziologische Theorie - auf Handlun- 
gen fokussiert, entwickelten sich in der Linguistik im Laufe der Zeit konversati- 
onsanalytisch inspirierte, aber dezidiert linguistische Ansätze, die rückblickend 
unter dem Begriff „Interaktionale Linguistik“ zusammengefasst werden können 
(z. B. Auer 1991, 1993, 1998; Günthner 1993, 1999a, b, Gohl/Günthner 1999, Sel- 
ting 2007, Ford/Thompson 1996 oder Ono/Thompson 1995). Der Begriff „Inter- 
aktionale Linguistik“ selbst wurde erst später von Couper-Kuhlen/Selting 
(2000; 2001a, b) in einigen programmatischen Artikeln und einem Sammelband 
geprägt und zu einem Forschungsprogramm ausgebaut. Die Autorinnen verwei- 
sen dabei explizit auf die Nähe der Interaktionalen Linguistik zur Konversati- 
onsanalyse, indem sie letzterer den Status eines „Interface“ zwischen Linguistik 
und Konversationsanalyse zuweisen: 


‚Interaktionale Linguistik‘ ist ein neuer Ansatz, als Interface von Linguistik im engeren 
Sinne und Konversations- bzw. Interaktionsanalyse konzipiert. [...] Die ‚interaktionale 
Linguistik‘ versteht sich klar als ein linguistischer Forschungsansatz. [...] Sprachliche 
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Strukturen sind auf die Erfüllung fundamentaler Aufgaben der Aktivitätskonstitution und 
der Interaktionsorganisation zugeschnitten, und hier primär der Interaktion im Rahmen 
natürlicher Alltagsgespräche. (Couper-Kuhlen/Selting 2001a: 260-261) 


Was die Interaktionale Linguistik auszeichnet, ist die Tatsache, dass linguisti- 
sche Fragestellungen im Zentrum stehen - d.h. es geht um die Beschreibung 
syntaktischer, semantischer, prosodischer und in letzter Zeit auch multimodaler 
Aspekte von Sprache. Dabei gilt es zu zeigen, wie sprachliche Strukturen „als 
dialogisch ausgerichtete Errungenschaften in der Zeit, die beim Vollzug von 
Sprechhandlungen während der Interaktion in Erscheinung treten“ (Günthner 
2007: 150), zu beschreiben sind. Gerade bei einem so zentralen linguistischen 
Konzept wie dem Satz wird diese Neuorientierung besonders deutlich: So 
schlägt Auer (2000; 2010) als Alternative zu statischen, produktorientierten 
Satzkonzepten mit der „on line-Syntax“ ein neues prozessorientiertes Beschrei- 
bungskonzept vor, das sich an dem Aufbau und Abarbeiten von Projektionen 
und möglichen Gestaltgrenzen orientiert und das besonders geeignet ist, mit der 
schrittweisen Erweiterung potentiell abgeschlossener Einheiten umzugehen 
(Auer 1991, 2006, 2007, 2010). Ebenso tritt neben das Interesse an dem „Ende 
deutscher Sätze“ (Auer 1991), d.h. an Fragen, wie Sätze schrittweise ‚on line‘ 
erweitert werden können, auch das Interesse an dem Anfang von Sätzen, ge- 
nauer gesagt an der Wirkungsweise von äußerungs- und sequenzprojizierenden 
Konstruktionen (z.B. Günthner 2001, 2008a, b; Imo 2012a; Wegner 2010). Erste 
Untersuchungen deuten darauf hin, dass auch in der computervermittelten 
Kommunikation die gleichen Prinzipien des Äußerungsaufbaus sowie der 
schrittweisen Erweiterung von Äußerungen am Werk zu sein scheinen (Imo 
2013: 277-280). 


2.2 Methodisches Vorgehen 


Das methodische Vorgehen der Interaktionalen Linguistik ist darauf ausgelegt, 
dem Datenmaterial einen besonders hohen Stellenwert einzuräumen. Aus die- 
sem Grund bilden detailreiche qualitative Analysen die Grundlage der Interak- 
tionalen Linguistik. Für ein strikt empirisches und ein qualitativ orientiertes 
Vorgehen sprechen zwei Gründe: Wenn man tatsächlich annimmt, dass Gram- 
matik als eine Sammlung von flexiblen Orientierungsmustern für Interagieren- 
de zu konzeptualisieren ist, so ist es zwingend notwendig, dass die für die Ana- 
lyse der Grammatik notwendigen Kategorien nicht aus Theorien übernommen 
werden, die sich entweder nur mit der abstrakten langue befassen und die Kon- 
zepte anhand erfundener Beispiele entwickeln (wie z.B. die Sprechakttheorie) 
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oder die primär mit monologisch orientierten Textdaten arbeiten (wie es in den 
meisten Referenzgrammatiken der Fall ist, die typischerweise auf Zeitungs- oder 
Literaturkorpora rekurrieren). Will man Grammatik in ihrer interaktionalen 
Verankerung beschreiben, so müssen dafür neue Kategorien entwickelt werden 
(Ono/Thompson 1995: 215). Der Zwang zur strikt empirischen Ausrichtung ent- 
steht also aus dem Ziel, Grammatik als Ergebnis und Voraussetzung von Inter- 
aktion zu betrachten. Die Fokussierung auf qualitative Analysen hängt eben- 
falls mit diesem Ziel zusammen. Erst dann, wenn alle potentiell relevanten 
Aspekte einer Interaktion berücksichtigt werden (Kontext, Prosodie, Orthogra- 
phie, Typographie/Graphostilistik, Sequenzialität, kommunikative Gattung, 
kommunikatives Projekt, multimodale und multimediale Aspekte), kann man 
davon ausgehen, eine grammatische Struktur vollständig in ihrer Wirkung er- 
fasst zu haben. Bei quantitativen Vorgehensweisen ist zwangsweise eine Reduk- 
tion der Parameter notwendig, die in die Analyse mit einbezogen werden kön- 
nen, was dazu führen kann, dass der Analyse möglicherweise relevante Aspekte 
entgehen. 

Die doppelte Beschränkung einerseits auf strikt empirisches Vorgehen und 
die Ablehnung der vorschnellen Übernahme etablierter Beschreibungskatego- 
rien und andererseits auf qualitative Herangehensweisen hat natürlich auch 
einen Nachteil, für den die Interaktionale Linguistik (wie auch die Konversati- 
onsanalyse) oft kritisiert werden: Es ist häufig unklar, ob das, was beschrieben 
wird, auch nur in Ansätzen einen universellen Charakter hat oder ob man nicht 
nur Strukturen beschreibt, die für Einzelfälle oder kleine Korpora ihre Gültigkeit 
haben. Letzterer Kritikpunkt wäre nur durch einen immensen Arbeitseinsatz 
auszugleichen, wie Ono/Thompson (1995: 221) feststellen: „A strictly empirical 
approach to identifying the schemas of a language would involve something 
like examining transcripts from thousands of hours of conversation, noting the 
recurrent syntactic patterns, and attempting to describe them“ (Ono/Thompson 
1995: 221). Ein solches Vorgehen ist wegen des damit verbundenen Arbeitsauf- 
wands nicht gangbar, und das gilt auch für die Analyse computervermittelter 
Kommunikation, bei der die Daten zwar bereits schriftlich vorliegen und man 
nicht erst aufwändig Transkripte erstellen und zudem die Audiodaten immer 
auch anhören muss, um die prosodische Realisierung zu erfassen, wo aber der 
Zeitaufwand dennoch enorm hoch ist, will man die Daten alle ‚von Hand‘ sich- 
ten und den jeweiligen situativen und sequenziellen Kontext berücksichtigen. 
Bereits bei kleinen Datenbanken wie dem öffentlich zugänglichen Teil des 
Dortmunder Chat-Korpus _(http://www.chatkorpus.tu-dortmund.de/korpo- 
ra.html#releasekorpus; vgl. auch Beißwenger 2007a) oder der Kurznachrich- 
tendatenbank MoCoDa (Mobile Communication Database) (http://mocoda. 


88 — imo 


spracheinteraktion.de/) stößt man bei einem solchen empirischen Vorgehen an 
die Grenzen des Machbaren. Dazu tritt auch noch die Tatsache, dass bislang erst 
wenige Korpora vorliegen, in denen interaktionale computervermittelte Kom- 
munikation öffentlich zugänglich gemacht wird - auch dies befördert die Ana- 
lyse von kleinen, von den ForscherInnen selbst erhobenen Korpora, was wiede- 
rum Angriffspunkte bezüglich der mangelnden Überprüfbarkeit der Ergebnisse 
sowie der Reichweite der Analyseergebnisse erzeugt. 

Das typische methodische Vorgehen der Interaktionalen Linguistik ist wie 
folgt zu beschreiben: Zunächst wird ein Korpus mit authentischen Daten erho- 
ben. „Authentisch“ heißt dabei, dass die Kommunikation nicht eigens für die 
Forschungszwecke inszeniert werden darf (vgl. Becker-Mrotzek/Brünner 2006: 
3), indem z.B. in einem experimentellen Setting Interagierende die Aufgabe 
bekommen, miteinander zu chatten, zu mailen oder SMS-Nachrichten auszu- 
tauschen (vgl. auch Lüger 2009 zum Erfordernis der Verwendung authentischer 
Daten). Präferiert werden dabei von der Interaktionalen Linguistik informelle 
Interaktionen untersucht, die nicht in einem institutionellen Setting entstanden 
sind (Couper-Kuhlen/Selting 2001a: 261). Diese Daten werden dann auf rekur- 
rente Muster untersucht, es wird gefragt, wie Interagierende auf bestimmte 
Strukturen reagieren, sie zurückweisen, thematisieren, ihr Verständnis anzei- 
gen, sie weiterbearbeiten oder korrigieren. Erst über den Einbezug der Rezipien- 
tenreaktionen (d.h. über ein sequenzielles Vorgehen) können schließlich be- 
lastbare Aussagen über die Funktionen von sprachlichen Mustern getroffen 
werden. 


3 Die Analyse computervermittelter 
Kommunikation im Rahmen der 
Interaktionalen Linguistik 


Im folgenden Abschnitt soll nun zunächst gezeigt werden, wie die oben darge- 
stellten, ursprünglich für die Analyse interaktionaler gesprochener Sprache 
entwickelten Methoden und Konzepte der Interaktionalen Linguistik sich auf 
die Analyse computervermittelter Kommunikation anwenden lassen. Bislang 
liegen für deutschsprachige computervermittelte Kommunikation noch relativ 
wenige Arbeiten vor, die interaktionslinguistische Konzepte anwenden (z.B. 
Androutsopoulos 2005, 2007, 2013, Beißwenger 2016, Bücker 2012, Dür- 
scheid/Brommer 2009; Dürscheid 2006, 2016, Günthner 2011, 2012, Günth- 
ner/Kriese 2012, Hauptstock/König/Zhu 2010, Imo 2011, 2012b, c, 2013, 2015a, b, 
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Ziegler/Tophinke 2014). Es zeigt sich dabei aber, dass der Ansatz der Interaktio- 
nalen Linguistik in der Tat dazu geeignet ist, neue Erkenntnisse in diesem Be- 
reich zu erlangen. Im Folgenden sollen nun zunächst die Vorteile dargestellt 
werden, interaktionslinguistisch zu arbeiten, im Anschluss daran werden einige 
Fallstudien mit den so gewonnenen Ergebnissen präsentiert und zum Schluss 
wird kurz auf ein Phänomen des Sprach- bzw. Kommunikationswandels in der 
elektronischen Kurznachrichtenkommunikation eingegangen. 


3.1 Die Vorteile interaktionslinguistischer Methoden für die 
Analyse computervermittelter Kommunikation: einige 
exemplarische Analysen 


Ein im deutschsprachigen Raum weit verbreitetes Modell, das bei der Analyse 
von computervermittelter Kommunikation häufig angewandt wird, ist das Nä- 
he-Distanz-Modell (bzw. das Modell medialer / konzeptioneller Mündlichkeit / 
Schriftlichkeit) von Koch/Oesterreicher (1985, 1994). Wie Dürscheid/Brommer 
(2009) betonen, erscheint dieses Modell insofern durchaus als ein geeigneter 
Kandidat für diese Aufgabe, als es „eine präzise Terminologie“ und einen „kon- 
zeptionellen Rahmen“ bereitstelle, „in dem SMS-, Chattexte und E-Mails zuei- 
nander und zu herkömmlichen Texten in Beziehung gesetzt werden können“ 
(Dürscheid/Brommer 2009: 14). Dennoch plädieren Dürscheid/Brommer (2009) 
in der Folge gegen dieses Modell und führen eine Reihe von Gründen an, die 
gegen es sprechen. Dazu gehören die Tatsachen, dass es ursprünglich ohne 
Blick auf computervermittelte Kommunikation, sondern nur anhand traditionel- 
ler Textsorten entwickelt wurde, dass der dort verwendete Medienbegriff um- 
stritten sei, dass der sequenzielle Charakter von vielen Kommunikationsformen 
in den Neuen Medien (Chat, E-Mail, SMS, Forenkommunikation etc.) nicht ge- 
nügend Berücksichtigung finde, und schließlich, dass das Modell zu statisch 
sei, die dynamischen, prozessorientierten Kommunikate dieser Kommunikati- 
onsformen zu erfassen. Da die ersten beiden Kritikpunkte relativ einfach zu 
beheben sind (vgl. dazu Imo 2016a) und nur die letzten beiden direkt die Inter- 
aktionale Linguistik als ein alternatives Analysemodell berühren, werde ich 
mich auf sie beschränken. 

Zum Punkt der mangelnden Berücksichtigung der Sequenzialität interakti- 
onaler Sprache merken Dürscheid/Brommer (2009: 15) an, dass das Modell von 
Koch/Oesterreicher „kein Instrumentarium bereitstellt, mit dem kommunikative 
Aktivitäten sequenziell untersucht werden könnten“. Angesichts der Tatsache, 
dass sich zahlreiche der Kommunikationsformen im Bereich der computerver- 
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mittelten Kommunikation dadurch auszeichnen, dass mit ihnen in mehr oder 
weniger schneller Reaktion (quasi-synchron) auf Vorgängerbeiträge kommuni- 
ziert wird (vgl. Dürscheid 2003), ist dies in der Tat ein deutlicher Nachteil. Die 
Interaktionale Linguistik (und natürlich auch die Konversationsanalyse) beto- 
nen immer wieder, dass gerade die Sequenzanalyse aus zwei Gründen einen 
besonders hohen Stellenwert haben sollte: Erstens, weil ein Erklärungsziel der 
Konversationsanalyse und Interaktionalen Linguistik darin besteht, die „inter- 
action order“ (Goffman 1983) von Sprache zu beschreiben und dem prozessori- 
entierten Charakter von interaktional eingesetzter Sprache Rechnung zu tragen 
(theoretischer Grund), und zweitens, weil nur über die Sequenzanalyse die 
jeweiligen Analysekategorien überhaupt validiert werden können (methodi- 
scher Grund). Dies geschieht dadurch, dass man anhand der Aufzeigepraktiken 
bzw. „Aufzeigeleistungen“ (Deppermann 2001: 50) der Personen, die jeweils auf 
einen Vorgängerbeitrag reagieren, Aussagen trifft über die Funktionen der syn- 
taktischen Strukturen dieses Vorgängerbeitrags. Ohne diese sequenzielle Vali- 
dierung wären solche Aussagen rein spekulativ (vgl. Deppermann 2014, Gül- 
ich/Mondada 2008 oder Schegloff 1990, 2007). 

Eng mit der Kritik an der Ausblendung der sequenziellen Struktur der 
Sprachverwendung in interaktionaler computervermittelter Kommunikation 
verbunden ist der Vorwurf, dass das Modell von Koch/Oesterreicher zu statisch 
und produktorientiert sei. Dies sei sogar einer der Gründe, so Dür- 
scheid/Brommer (2009: 15), „warum das Modell in der englischsprachigen Lite- 
ratur kaum rezipiert“ werde.' Das Fazit ist auch hier, dass die Interaktionale 
Linguistik als Analysemodell vorzuziehen ist, da dort vor allem Fragen zur Ein- 
heitenbildung (z.B. Auer 2010; Imo 2013: 200-236), zum inkrementellen Aufbau 
von Äußerungen (Auer 2000; 2006; 2007; vgl. ausführlich Imo 2013: 277-281 zu 
einem Vergleich inkrementellen Äußerungsaufbaus und der von Beißwenger 
2007b: 264 beschriebenen „splitting“-Strategien im Chat) und zur lokalen, pro- 
zessualen Entstehung von Bedeutung und Struktur (Auer 2003; Auer/Pfänder 
2011; Bücker 2012; Deppermann 2007; Deppermann/Schmidt 2001; Depper- 
mann/Schmitt 2008; Günthner 2007; zum Revidieren von Äußerungen im Chat 


1 Im englischsprachigen Raum ist beispielsweise stattdessen vor allem das Modell der „Com- 
puter-Mediated Discourse Analysis“ (Herring 2004, 2007, 2010, 2011; ein Überblick über prag- 
matische Analysen von computervermittelter Kommunikation findet sich in Her- 
ring/Stein/Virtanen 2013; speziell zu SMS sind Untersuchungen von Spagnolli/Gamberini 2007 
und Thurlow/Poff 2013 zu nennen) weit verbreitet, das in Ansätzen Ähnlichkeiten zu dem der 
Interaktionalen Linguistik aufweist. 
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Beißwenger 2010) traditionell im Mittelpunkt stehen, von denen die Analyse 
computervermittelter Kommunikation profitieren kann. 

Im Folgenden sollen nun exemplarisch drei Studien präsentiert werden, die 
sich aus interaktionslinguistischer Perspektive mit der Kommunikation in SMS, 
Foren und Online-Communities befasst haben. 

Günthner (2011) führt eine qualitative Analyse eines SMS-Korpus durch, das 
SMS-Dialoge von SchreiberInnen unterschiedlicher Altersgruppen in unter- 
schiedlichen Kommunikationssituationen enthält. Günthner (2011: 7) stellt da- 
bei die These auf, dass SMS-Dialoge trotz der Tatsache, dass sie nicht in einer 
Face-to-face-Situation stattfinden, sondern sowohl räumlich als auch zeitlich 
versetzt realisiert werden, „keine monologischen, interaktionslosgelösten 
Kommunikationsformen“ seien, sondern dass die SMS-SchreiberInnen sich 
„dialogisch an einem Gegenüber“ ausrichten, indem sie „Bezug auf vorherige 
kommunikative Handlungen des Gegenübers“ nehmen und „Folgehandlungen 
erwartbar machen“. Dadurch entsteht eine sprachliche Struktur, die sich ähn- 
lich zu der verhält, wie sie sich auch in gesprochensprachlicher Face-to-face- 
Interaktion finden lässt. Von besonderer Bedeutung ist dabei die Tatsache, dass 
SMS-Dialoge „sequenziell organisiert sind und ihre Bedeutung im (sequenziel- 
len) Kontext zu interpretieren ist“ (Günthner 2011: 8). Aus den unterschiedli- 
chen interaktionalen Aspekten, die von Günthner (2011: 8-9) analysiert werden 
(rituelle Rahmungen der SMS-Beiträge; sequenzielle Organisationsstrukturen; 
dialogische und zeitlich progrediente Bedeutungskonstitution; Adjazenzpaare; 
Rezipientenorientierung), werde ich exemplarisch den Aspekt der Bedeutungs- 
konstitution in der Interaktion herausgreifen, da dort besonders gut die eben 
erwähnte Relevanz der sequenziellen Strukturierung für die Herausbildung 
sprachlicher Muster gezeigt werden kann. Anhand eines SMS-Dialogs, in dem 
die Interagierenden mit einem Loriot-Zitat spielen, kann die Kontextbezogen- 
heit der Bedeutungsentstehung gut illustriert werden: 


SMS-Dialog „NEUES KLEID“ (zitiert nach Günthner 2011: 21-22) 


Anja an Clara: 30.4.2010, 11:02 

Habe ein neues Kleid. Rate welche Farbe... 
Clara an Anja: 30.4.2010, 11:08 

Frisches aschgrau? ;-) 

Anja an Clara: 30.4.2010, 11:21 Uhr 
Mausgrau! 

Clara an Anja: 30.4.2010, 11:35 Uhr 
Steingrau 

Anja an Clara: 30.4.2010, 11:37 Uhr 
Betongrau 
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Clara an Anja: 30.4.2010, 11:40 Uhr 
Zementgrau 

Anja an Clara: 30.4.2010, 11:49 Uhr 

Hach, das müssen wir mal wieder gucken :-) 


Wie Günthner (2011: 21-23) betont, folgen die einzelnen SMS-Nachrichten 
schnell aufeinander und sind ohne den Bezug auf die jeweiligen Vorgänger- 
SMS-Nachrichten nicht verständlich. Erst in ihrer Gesamtheit entsteht durch das 
gegenseitige „Zuwerfen“ immer neuer Grauvarianten das Sprachspiel, das 
schließlich in der letzten Nachricht im Sinne einer Verstehensdokumentation 
als ein Spiel mit Zitaten aus einem (Loriot)-Film markiert wird. Die Kontextuali- 
sierung von Verstehen spielt aber schon früher in dem Dialog eine Rolle, wenn 
nämlich Clara in SMS Nr. 2 ihre Antwort „Frisches aschgrau?“ mit einem zwin- 
kernden Emoticon (,,;-)“) als scherzhafte Interaktionsmodalität markiert und so 
eine Interpretationshilfe gibt, die Anja dabei hilft, die Äußerung als ein Spiel 
mit fremder Rede, also als Filmzitat, zu verstehen. Auch das ausgedehnte Hin- 
und Her, in dem sich die SMS-Schreiberinnen einen Grauton nach dem anderen 
‚zuwerfen‘, ist typisch fiir interaktionale Sprache: Durch „die kollaborative 
Konstruktion ihres SMS-Dialogs“ bauen Anja und Clara „zugleich soziale Nähe 
und Kooperativität auf“ (Günthner 2011: 23). Dabei ist jeder Folgebeitrag nur in 
Bezug auf die jeweiligen Vorgängerbeiträge als kohärenter, sinnvoller An- 
schluss zu verstehen. Losgelöst aus dieser Sequenz wären die Äußerungen 
kaum verständlich. Wie dieses Beispiel zeigt, sind rein sprachliche Aspekte in 
interaktionaler computervermittelter Kommunikation mit sozialen, das Interak- 
tionsmanagement betreffenden Aspekten untrennbar miteinander verwoben. 
Eine Analyse, die nicht sequenziell vorgeht, sondern nur die Einzeläußerungen 
betrachtet, ist blind für diese Funktionen und die besondere Struktur interakti- 
onaler Sprache. 

Eine zweite Untersuchung, die hier präsentiert werden soll, ist die von 
Bücker (2012) zu der von ihm so genannten „nicht-finiten Prädikationskonstruk- 
tion“ (NFPK). Diese umfasst Muster des Typs „Ich...eine Kontaktanzeige?“, 
„Promotion? Ich?“ oder „Ich und schlafen... Träum weiter“ (Bücker 2012: 1-2). 
Für die Untersuchung wurden mehrere Teilkorpora erstellt, unter anderem ein 
kleines Teilkorpus mit gesprochener Sprache sowie ein Primärkorpus, das sich 
vor allem auf Usenet- und Forendaten stützt (Bücker 2012: 91). Dabei ist die 
Begründung für die Zusammenstellung dieses Korpus von Bedeutung: Die von 
Bücker untersuchte NFPK zeichnet sich dadurch aus, dass sie hochgradig dialo- 
gisch ausgerichtet ist und daher entsprechend auch primär in Kontexten auf- 
tritt, in denen dialogisch kommuniziert werden kann. Aus diesem Grund bot es 
sich nicht an, beispielsweise Zeitungskorpora zu verwenden, denn in rein mo- 
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nologischen Textsorten kommt die NFPK „so gut wie gar nicht“ vor (Bücker 
2012: 91). Es ist vielmehr zu beobachten, dass in den wenigen Fällen, in denen 
ein monologisches Setting vorliegt, in dem eine NFPK eingesetzt wird, diese 
eine „virtuelle Dialogizität“ (Bücker 2012: 3) erzeugt - ein Beleg dafür, dass die 
dialogische Verankerung der NFPK zentral ist und somit auch dialogisch orien- 
tierte Analysemethoden wie die Interaktionale Linguistik notwendig sind, um 
die Funktionen von NFPK beschreiben zu können: 


Die NFPK-Instanziierungen [...] werden vom Rezipienten als so stark dialogisch geprägte, 
d.h. an bestimmte Dialogkontexte und bestimmte gesprächsstrukturierende Funktionen 
gekoppelte kommunikative Ressourcen wahrgenommen, dass sie in monologischen Zei- 
chenumgebungen den Eindruck ‚virtueller Dialogizität‘ zu erzeugen vermögen. (Bücker 
2012: 3) 


Bücker (2012: 124) orientiert sich dabei an Linells (2009) Ansatz des Dialogism 
und stellt fest, dass „die Konstrukte (d.h. die konkreten Instantiierungen; W.I.) 
der NFPK als ‚inter-acts‘“ aufzufassen sind, die dazu dienen, „Ressourcen für 
themen- und aktivitätsbezogene Sequenzierungspraktiken“ bereitzustellen, die 


sich retraktiv (verstanden als auf einen im sequenziellen Verlauf zurückliegenden Be- 
zugspunkt verweisend und diesen weiterführend) als gesprächsdeiktisch verankerte The- 
mensetzung und projektiv (verstanden als den nachfolgenden sequenziellen Verlauf rah- 
mend und vorstrukturierend) als Reparaturinitiierung charakterisieren lassen (Bücker 
2012: 124-125). 


Auch hier gilt also wieder, dass eine rein quantitative und / oder automatisierte 
Auswertung der Daten für zentrale Aspekte der NFPK blind bliebe: Nur im Kon- 
text sowohl von kommunikativen Praktiken und Aktivitäten als auch als Teil 
einer größeren sequenziellen Struktur offenbaren die NFPK ihre Funktionen. 
Eine qualitative, diese Kontexte berücksichtigende Analyse ist daher notwen- 
dig. Bücker (2012: 125-166) zeigt, dass mit der NFPK „gesprächsdeiktisch veran- 
kerte Themensetzungen“, „konversationelle ‚Buchführungen‘ sowie bewerten- 
de und deliberative Reparaturen im Spannungsfeld zwischen der Zustimmung 
und dem Widerspruch zu von Interaktionspartnern zuvor getätigten Aussagen“ 
durchgeführt werden. Die qualitative Analyse ergab somit, dass die NFPK in 
einem funktional klar abgrenzbaren Rahmen operiert, der darin besteht, „dass 
der Produzent des NFPK-Konstrukts die unterstellte Gültigkeit oder Berechti- 
gung der gesprächsdeiktisch zum Thema gemachten Aussage konversationell 
als eine kommentierungsbedürftige ‚Problemstelle‘“ anzeigt, die in der Folge 
dann ein „positionierungsrelevantes ‚stance-taking‘“ ankündigt. Diese Verbin- 
dung mit Positionierungsaktivitäten erklärt auch den Befund, dass sich die 
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NFPK typischerweise in „Argumentations- Streit- oder ‚Teasing‘-Kontexten“ 
findet (Bücker 2012: 164). 

Die dritte Untersuchung, auf die hier verwiesen werden soll, stammt von 
Androutsopoulos (2003) und fokussiert auf die Sprachvariation in Online- 
Gemeinschaften. Der Ausgangspunkt ist dabei nicht die Interaktionale Linguis- 
tik (die erst kurz zuvor unter diesem Namen als Forschungsprogramm von Cou- 
per-Kuhlen und Selting 2000, 2001a, b initiiert wurde), sondern die Interaktio- 
nale Soziolinguistik, die viele Annahmen der Interaktionalen Linguistik teilt. 
Der Grund für die hier vorgenommene Ausweitung der Forschungsperspektiven 
auf die Interaktionale Soziolinguistik ist, dass bis heute nur wenige Arbeiten im 
Bereich der computervermittelten Kommunikation vorliegen, die dezidiert dem 
Ansatz der Interaktionalen Linguistik verpflichtet sind. Die qualitative Heran- 
gehensweise und die im Folgenden von Androutsopoulos (2003: 1) skizzierten 
methodischen und theoretischen Annahmen machen die engen Bezüge seines 
Ansatzes zur Interaktionalen Linguistik aber deutlich: 


Sprachvariation im Netz ist nicht nur von den Kennzeichen der verschiedenen Dienste ab- 
hängig, sondern auch vom sozialen Kontext, in dem die Dienste jeweils angeeignet wer- 
den. Meine soziolinguistische Perspektive auf Sprache im Internet stimmt mit soziologi- 
schen und sozialpsychologischen Ansätzen der Online-Forschung darin überein, dass das 
Netz nicht einfach als Supermedium oder gigantisches Textarchiv betrachtet wird, son- 
dern als ‚sozialer Handlungsraum‘, ‚in dem Menschen textbasiert synchron und asyn- 
chron miteinander kommunizieren‘ (Döring 1999: 409). 


Die Fokussierung auf interaktionale Aspekte des Kommunizierens und die Wahl 
eines qualitativen Zugangs führt auch bei der Untersuchung von Androutsopou- 
los dazu, dass Aspekte in den Blick geraten, die bei einem quantitativen Zugang 
kaum zu erfassen sind. Auf der Basis von Kommunikationsbeispielen von Onli- 
ne-Communities in Portalen, Chats, Gästebüchern und E-Mails wird diskutiert, 
wie sprachliche (z.B. Varietäten, Darstellung konzeptioneller Mündlichkeit, 
Stilistik) und außersprachliche (z.B. Einfluss des Mediums, soziodemographi- 
sche Variablen) Faktoren dazu beitragen, Sprachgemeinschaften zu erzeugen. 
So stellt Androutsopoulos (2003: 13) fest, dass „unter gesprächs- bzw. interakti- 
onsanalytischen Gesichtspunkten“ die sprachlichen Varianten, die sich in den 
untersuchten Daten finden lassen, „als Ressourcen der Image-Arbeit und als 
Kontextualisierungshinweise in Online-Interaktionen“ eingesetzt werden. Mit 
Hilfe von Regionalismen, von Stilwechseln oder von Code-Switching werden 
beispielsweise „lokale Kontraste zu vorangehenden Beiträgen oder zu den Nor- 
men einer Gemeinschaft“ (Androutsopoulos 2003: 13) geschaffen, die dann 
einen Wechsel der Interaktionsmodalität, Ironie, Übertreibungen, Face-work 
u.a. signalisieren können. Da Bezüge auf lokal ausgehandelte Normen oder 
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Kommunikationspraktiken nur durch eine umfassende Kontextanalyse erfasst 
werden können, helfen qualitative, interaktional ausgerichtete Ansätze bei dem 
tieferen Verständnis des Einsatzes von Sprache in der computervermittelten 
Kommunikation. 


3.2 Die MoCoDa: Eine Datenbank zur qualitativen Analyse 
computervermittelter und internetbasierter 
Kurznachrichtenkommunikation 


In diesem Abschnitt soll nun ein von mir initiiertes Korpus- und Forschungspro- 
jekt zur elektronischen Kurznachrichtenkommunikation vorgestellt werden. Das 
Herzstück bildet dabei eine Datenbank, in der unterschiedliche Formen von 
Kurznachrichten, also sowohl ‚klassische‘ SMS-Nachrichten als auch neuere 
Messaging-Formate wie beispielsweise solche über den auf vielen Smartphones 
laufenden internetbasierten Dienst „WhatsApp“ gespeichert werden. Die Tatsa- 
che, dass in der Datenbank neben der ‚klassischen‘ SMS auch Kurznachrichten 
über Dienste wie „WhatsApp“ gespeichert werden, hat Auswirkungen auf die zu 
nutzende Terminologie. Im Kontext des „empirikom“-Netzwerks wurde von 
Beißwenger der Terminus „IBK“ (internetbasierte Kommunikation) vorgeschla- 
gen, um eine Trennung zu weiter gefassten Begriffen wie der „computer media- 
ted communication“ (CMC), der „electronically mediated communication“ 
(EMC) oder der „digitally mediated communication“ (DMC) vorzunehmen (vgl. 
Crystal 2011 sowie Jucker/Dürscheid 2012: 39-40 zu einer entsprechenden 
terminologischen Diskussion). Das Problem mit dem Begriff der „computer 
mediated communication“ ist, dass im Prinzip auch ein Mobiltelefonat als com- 
putervermittelte Kommunikation aufgefasst werden müsste (und SMS-Kom- 
munikation ohnehin), was dieses Konzept zu weit fassen würde (das gleiche gilt 
auch für „electronically“ oder ,,digitally“ mediated communication, die auch 
Fernsehen, digitales Radio etc. enthalten würden). 

Eine Lösung für dieses Problem bestand in der bereits erwähnten, von 
Beißwenger vorgeschlagenen Bezeichnung der „internetbasierten Kommunika- 
tion“. Auch diese Lösung ist allerdings problematisch, denn damit wird eine 
Einschränkung vorgenommen, die beispielsweise Online-Telefonie zulässt, 
Handy-Telefonate jedoch nicht, und die daher gerade im Bereich der SMS- 
Kommunikation zu nicht nachvollziehbaren Grenzziehungen führen muss: Eine 
‚klassische‘ SMS-Nachricht ist nicht als internetbasierte Kommunikation aufzu- 
fassen, eine über das populäre Programm „WhatsApp“ verschickte SMS- 
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ähnliche Nachricht, die die ‚klassische‘ SMS zunehmend verdrängt, dagegen 
schon. 

Jucker/Dürscheid (2012: 40) stellen auf Grund solcher Probleme alle bishe- 
rigen Bezeichnungsvorschläge in Frage und versuchen, einen eigenen Vor- 
schlag zu entwickeln. Dabei sollen mit dem neu gebildeten Begriff die Formen 
von Kommunikation erfasst werden, die „a) primarily graphically realized”, „b) 
either in a one-to-one, a one-to-many or a many-to-many format“ und „c) medi- 
ated by cell phones, smart phones or networked PC tablets and computers” 
vorliegen. Das Ergebnis ist Folgendes: „The term we suggest for these commu- 
nication practices is ‚keyboard-to-screen communication‘ (KSC). This term co- 
vers all forms of communication which fulfill the three requirements mentioned 
above without focusing on the use of a particular medium.” (Jucker/Dürscheid 
2012: 40) 

Der Vorteil, von KSC zu sprechen, besteht darin, dass damit Mischungen 
unterschiedlicher Produktions- und Rezeptionsmedien keine Rolle mehr spie- 
len: 


We hereby take into account that there is a shift from medium-specific communication 
towards ‚content that flows across multiple media channels‘ as pointed out by Jenkins 
(2006: 243). We even go a step further than Jenkins by assuming that, within KSC commu- 
nication, there is not only a convergence of media, but also a convergence of forms of 
communication: The user does not have to change either the medium (e.g. telephone vs. 
computer) in order to switch to another communicative activity or the platform to use an- 
other communication tool. Of course, there are different technical devices involved in KSC 
(Blackberries, iPhones, iPads, PCs, etc.), but all these devices, as different as they are, 
have one thing in common, i.e. a physical keyboard (or a virtual one on a touch-screen) 
and a screen. (Jucker/Dürscheid 2012: 41) 


Gerade für den Bereich der Kurznachrichtenkommunikation ist dies besonders 
relevant, da die Tatsache, dass Kurznachrichten schriftlich verfasst und digital 
verschickt werden, für die Kommunikationsform in der Tat zentral ist, nicht 
aber die Tatsache, dass dies mit einem bestimmten Dienst oder einem bestimm- 
ten Eingabegerät geschieht (obwohl diese Faktoren selbstverständlich ebenfalls 
einen Einfluss haben und zu verändertem Kommunikationsverhalten führen 
können). In der Folge wird daher der Begriff der KSC-Kommunikation als Ober- 
begriff für die in der MoCoDa enthaltenen Daten verwendet. 

Der Aufbau der MoCoDa wurde 2011 begonnen, das Ziel ist es, kontinuier- 
lich informelle private Kurznachrichtenkommunikation einzuspeisen, um so 
nicht nur ein zunehmend größeres Datenkorpus zu erhalten, sondern auch ein 
Korpus, das im Laufe der Zeit für (mikro)diachrone Fragestellungen genutzt 
werden kann. Die Datenbank ist passwortgeschützt, aber für die Forschung 
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zugänglich und kann http://mocoda.spracheinteraktion.de eingesehen werden. 
Im Jahr 2016 sind Michael Beißwenger und Evelyn Ziegler in das Projekt einge- 
stiegen und im Jahr 2017 wird die Datenbank mit Förderung des MIWF NRW 
(Projektnummer 1606if015) umfassend ausgebaut und es werden neue Funktio- 
nen implementiert (Darstellung von Emojis, Bildern, Audio- und Videodateien; 
Annotationsfunktionen; Recherchefunktionen; Interoperabilität). 

Zum Zeitpunkt des vorliegenden Artikels (Oktober 2016) umfasste die Da- 
tenbank über 2.000 Kurznachrichtendialoge, die aus mehr als 70.000 einzelnen 
Nachrichten bestehen und einen Umfang von ca. 170.000 Wörtern bzw. 
1.000.000 Zeichen haben. Im Vergleich zu traditionellen textbasierten Korpora 
ist dieser Umfang gering, eine rein quantitative Auswertung bietet sich daher 
weniger an. Der geringe Umfang liegt dabei einerseits in der Natur der Kurz- 
nachrichten begründet und andererseits in der Tatsache, dass Kommunikation 
über SMS oder Messenger-Programme wie WhatsApp - anders als beispielswei- 
se Forenkommunikation, Blogs, Online-Zeitungen, Chat-Protokolle u.ä. — eine 
private, nicht-öffentliche Kommunikationsform darstellt, und die ‚Datenspende‘ 
entsprechend aufwändig zu organisieren ist. Das führt dazu, dass das Kurz- 
nachrichtenkorpus eher als qualitatives Korpus zu nutzen ist, was allerdings auf 
Grund der hochgradig interaktionalen, ko- und kontextbezogenen Kommunika- 
tion in Kurznachrichten insofern kein Nachteil ist, als Analysen — wie im vori- 
gen Abschnitt bei den zitierten Untersuchungen von Günthner (2011), Bücker 
(2012) und Androutsopoulos (2003) gezeigt - ohnehin sequenziell, kontextbe- 
zogen und somit qualitativ vorgehen müssen. 

Damit technische und ethnographische Hintergrundinformationen in die 
Analyse einbezogen werden können, wird eine Reihe von Metadaten erhoben. 
Diese umfassen Angaben zum Alter der SchreiberInnen, zum Geschlecht, Beruf 
und Bildungsstand, zur regionalen Herkunft der SchreiberInnen, zu deren 
Standort, zum Eingabemodus in die Mobiltelefone (z.B. manuell ohne Korrek- 
tursoftware, unter Verwendung der Korrektursoftware „T9“ oder auf einem 
Smartphone mit Tastatur), zum Tarif (Flatrate, Einzelabrechnung etc.) und zur 
Beziehung der SchreiberInnen zueinander. Zudem steht bei Bedarf ein Kom- 
mentarfeld bereit, in dem z.B. unbekannte Ausdrücke wie Verweise auf ein Café 
o.ä. erläutert werden können. Darüber hinaus werden aktivitätsbezogene Kate- 
gorien ausgewählt, die das Hauptthema des Kurznachrichtendialogs bezeich- 
nen (z.B. Verabredung treffen, Liebeskommunikation, Streit, Langeweile etc.). 

Die Suche in der Datenbank läuft einerseits über eine einfache, oberflä- 
chenorientierte Anfrage nach Wörtern bzw. Zeichen, darüber hinaus kann man 
aber auch die Suche nach Zeichenfolgen mit Hilfe der Metadaten filtern (z.B. 
nur nach dem Vorkommen des Emoticons :-) in ‚Streit-Kurznachrichten‘ su- 
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chen) oder sich auch alle Nachrichten anzeigen lassen, die zu einer Metadaten- 
Kategorie gehören (z.B. alle Verabredungen). 


Metadaten der Schreiberinnen: 


Schreiberin A Schreiberin B 


Alter. 
Herkunft: Herkunft: [NRW 
SSS — BD m 
Geschlecht": [männlich =) [weiblich z] 
Eingabemodus T9-Unterstützung >) Eingabemodus: [ Smartphone mit Tastatur ~] 
SMS-Tarit: [Einzelabrechnung >10ct =] SMS-Tant: [SMS-Flatrate | 


Beziehung der Schreiberinnen zueinander: Pärchen hd 


Weitere relevante Informationen: 
optonal 


Abb. 1: Darstellung der Metadaten in der MoCoDa 


Zum Abschluss soll kurz noch auf eine kommunikative Besonderheit eingegan- 
gen werden, die dafiir spricht, den weiter gefassten Begriff der KSC, wie er von 
Jucker/Diirscheid (2012) vorgeschlagen wurde, zu verwenden. Eine Beobach- 
tung war, dass immer dann, wenn mittels ,traditioneller‘ SMS-Nachrichten in 
Einzelabrechnungen kommuniziert wurde, die SMS-Nachrichten stark kompri- 
miert waren und zahlreiche separate Einzelhandlungen enthielten, wenn dage- 
gen die SchreiberInnen entweder SMS-Flatrates nutzen oder - was zunehmend 
häufiger der Fall ist - über „WhatsApp“ und somit über die Internet-Flatrate 
kommunizieren, eine Tendenz dazu besteht, alle Einzelhandlungen auch je- 
weils in einzelnen Nachrichten zu realisieren (Imo 2015b). Dies soll im Folgen- 
den anhand zweier Dialoge illustriert werden. Der erste Dialog findet zwischen 
zwei Freundinnen (23 und 35 Jahre alt) statt. Schreiberin A (linke Spalte) hat 
zwar ein Smartphone mit Tastatur, nutzt aber einen Tarif mit Einzelabrechnung 
von über 10 Cent pro SMS: 
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Beispiel 1: Dialog #2171 


Hallo ich wollte mal wegen der Reitstunde fragen, es ist 
ja nur am regnen! Der platz steht bestimmt unter wasser 
oder? Und morgen soll es ja auch wieder regnen. Meinst 


du sollen wir ausfallen lassen? Liebe Grüße (Name) 
Nachricht #1 - 01.11.2012 - 15:32:00 


Wäre mir auch ganz recht, weil ich morgen früh noch 


zum laternenbasteln muss. Gruß (Name) 
Nachricht #2 - 01.11.2012 - 17:03:00 


Ja gut, alles klar! Dann einen schönen feiertag noch! Bis 


dann! 


Nachricht #3 - 01.11.2012 - 17:04:00 


Die komprimierte Struktur ist gut zu erkennen: In SMS-Nachricht #1 finden sich 
mit dem Gruß („Hallo“), dem Grund für die SMS („ich wollte mal wegen der 
Reitstunde fragen ...“), einem Vorschlag („Meinst du sollen wir ausfallen las- 
sen?“) und der Verabschiedung („Liebe Grüße (Name)“ vier interaktionale Akti- 
vitäten (in Nachricht #2 finden sich zwei, in Nachricht #3 drei Aktivitäten). 

Ganz anders dagegen in folgendem Austausch zwischen zwei Freundinnen 
(beide 20 Jahre alt), die beide ein Smartphone mit einer SMS-Flatrate nutzen. 
Die Veränderungen im Kommunikationsverhalten sind klar zu erkennen: 


Beispiel 2: Dialog #2004 


Hey 
Nachricht #1 - 23.11.2012 - 10:04:05 
Was hast du in Pädagogik? 
Nachricht #2 - 23.11.2012 - 10:04:05 
2,0:D 


Nachricht #3 - 23.11.2012 - 10:04:05 
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Und du? 
Nachricht #4 - 23.11.2012 - 10:04:05 
Super! 
Nachricht #5 - 23.11.2012 - 10:04:05 
Insgesamt mit der Päda-Klausur 2,1 
Nachricht #6 - 23.11.2012 - 10:05:05 


Weif ich noch nicht, kann von meinem Handy aus nur 
sehen, dass ich bestanden habe, aber nicht mit welcher 


Note... 

Nachricht #7 - 23.11.2012 - 10:05:05 
Nicht schlecht... 

Nachricht #8 - 23.11.2012 - 10:05:05 


Habe damit nicht gerechnet... kannst du mit deinem 


Handy nicht auf lounge gehen? 
Nachricht #9 - 23.11.2012 - 10:06:05 
*leistungen 

Nachricht #10 - 23.11.2012 - 10:06:05 


Ja doch, aber das schneidet die Spalte mit der Note leider 


irgendwie weg... 
Nachricht #11 - 23.11.2012 - 10:07:05 
Achso das ist scheisse 
Nachricht #12 - 23.11.2012 - 10:08:05 


Jup. Mein Freund schaut gleich mal auf seinem Compu- 


ter. 


Nachricht #13 - 23.11.2012 - 10:08:04 
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Besonders deutlich wird die Tendenz, für jeweils einzelne Handlungen auch 
eine eigene Nachricht zu versenden, anstatt mehrere Handlungen zusammenzu- 
fassen, in den Nachrichten 3 und 4, wo die Schreiberin erst in Nachricht 3 die 
Frage aus Nachricht 2 nach der Klausurnote mit „2,0 :D“ beantwortet und in 
Nachricht 4 dann eine eigene Anschlussfrage („Und du?“) stellt. Solche Frage- 
Gegenfrage-Muster gehören eigentlich eng zusammen und man könnte erwar- 
ten, dass sie als zwei zusammengehörige Teilhandlungen in einer Nachricht 
realisiert werden (,,2,0 :D, und du?“). Dennoch werden hier zwei Nachrichten 
für die beiden Handlungsschritte verwendet. Auch in den Nachrichten 9 und 10 
zeigt sich, dass die Informationen schrittweise übermittelt werden, in Nachricht 
9 erfolgt zunächst die Anweisung, dass Schreiberin A mit ihrem Handy auf die 
Internetseite „lounge“ gehen soll, gefolgt von dem nächsten Schritt, der Anwei- 
sung, auf „*leistungen“ zu klicken. Die Kurznachrichtenkommunikation nähert 
sich dabei deutlich der Chatkommunikation an (vgl. Beißwenger 2007), in der 
ebenfalls eine Präferenz für kurze Nachrichten und das „Splitten“ von Nach- 
richten in Teilhandlungen besteht. 

Die hier vorgestellte Analyse des durch technische (und ökonomische) Ge- 
gebenheiten sich ändernden Kommunikationsverhaltens ist nur ein Beispiel für 
qualitative Analysen auf der Basis des MoCoDa-Korpus. Auch für die Untersu- 
chung des Gebrauchs von Emoticons (Imo 2015a), der syntaktischen und se- 
quenziellen Strukturen von interaktionaler KSC (Imo 2013: 269-284; Imo 2015b) 
oder von kollaborativen Aktivitäten wie der Liebeskommunikation (Imo 2012c) 
bieten sich diese Daten an. 


4 Fazit 


Das Ziel des vorliegenden Beitrags war es, ein Plädoyer für qualitative Analysen 

von computervermittelter - bzw., genauer, von keyboard-to-screen Kommuni- 

kation (KSC) - zu liefern. Dabei wurde naturgemäß auf die Vorteile eines sol- 
chen Vorgehens fokussiert. Es darf jedoch nicht übersehen werden, dass eine 
qualitative Herangehensweise auch mit Nachteilen verbunden ist: 

— Der Arbeitsaufwand einer qualitativen Analyse ist sehr hoch. Damit die 
Korpora überhaupt vollständig ausgewertet werden können, müssen sie 
entsprechend klein sein, was im Extremfall bis hin zu Einzelfallanalysen 
gehen kann, wenn eine vollständige Rekonstruktion des Interaktionsablau- 
fes intendiert wird. Bei einem solchen Vorgehen kann als Kritik angebracht 
werden, dass die Aussagekraft der Untersuchung und die Möglichkeiten der 
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Verallgemeinerbarkeit der Ergebnisse möglicherweise nicht besonders groß 
sind. 

Eng damit zusammenhängend ist als weiterer Nachteil die Tatsache zu 
nennen, dass die Analysen aufwändig sind, da alle Fälle mit ihrem sequen- 
ziellen Kontext (und bei Bedarf noch zusätzlichen ethnographischen Hin- 
tergrunddaten) betrachtet werden müssen. Das schränkt die Menge an Fäl- 
len ein, die man überhaupt berücksichtigen kann, vor allem dann, wenn es 
sich um häufige Phänomene wie z.B. Emoticons (vgl. Imo 2015a) handelt. 


Den genannten Nachteilen stehen aber auch Vorteile gegenüber bzw. manche 
der Nachteile können durch eine Verbindung von quantitativen und qualitati- 
ven Ansätzen behoben werden: 


So kann gegen den ersten Kritikpunkt, die geringe Datenmenge, einge- 
wandt werden, dass auf der Basis einer solchen qualitativen Studie, in der 
detailliert das Form- und Funktionsspektrum eines Phänomens herausge- 
arbeitet wurde, eine Überprüfung der Ergebnisse an großen Korpora leicht 
möglich ist. Der Vorteil bestünde in einer Kombination aus Detailreichtum 
der Beschreibung in der qualitativen Studie und Plausibilität durch Daten- 
mengen in der quantitativen Studie. 

Auch hier hängt das zweite Argument eng mit dem ersten zusammen: Die 
Analyse ist zwar aufwändig und aus diesem Grund auf wenige Daten be- 
schränkt, dafür sinkt aber die Chance, dass relevante Aspekte eines Phä- 
nomens übersehen werden, wie es in quantitativen Ansätzen, die meist auf 
der Wort- oder Satzebene operieren, aber nur in geringem Maße Aspekte der 
Sequenzialität und Interaktionalität von Strukturen berücksichtigen kön- 
nen, geschehen kann. 

Als dritter Vorteil kann angeführt werden, dass durch die detaillierte und 
umfassende Analyse neue, bislang noch nicht beschriebene sprachliche 
oder interaktionale Phänomene entdeckt werden können. Dieses Vorgehen 
ist auf das gesprächsanalytische Konzept der „observations“ zurückzufüh- 
ren, d.h. auf die Methode, in den Daten nach erklärungsbedürftigen Phä- 
nomenen zu suchen: „We will be using observations as a basis for theori- 
zing. Thus we can start with things that are not currently imaginable, by 
showing that they happened.” (Sacks 1984: 25) 

Ein letzter Vorteil besteht darin, dass zentrale menschliche Aktivitäten, die 
in der Interaktion durchgeführt werden, wie das Herstellen von Intersubjek- 
tivität und Sozialität, nur durch hermeneutische, so viele Details wie mög- 
lich berücksichtigende Verfahren rekonstruiert werden können. Für solche 
Fragestellungen sind daher ebenfalls qualitative Ansätze notwendig. 
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Eva-Maria Jakobs, Claas Digmayer und Bianka Trevisan 
Methoden der IBK-Forschung: Zum Einfluss 
von Gebrauchsmuster, Domäne und Nutzer 


1 Einführung 


In Literatur und Öffentlichkeit wird zum Teil generalisierend von „internetba- 
sierter“ Kommunikation (IBK) gesprochen. Sie wird charakterisiert durch 
Schnellschreib-Phänomene, eine Tendenz zu sprachlicher Ökonomie, Orientie- 
rung am Duktus der gesprochenen Umgangssprache, „verschriftete Umgangs- 
sprache“ und/oder die Verwendung innovativer semiotischer und sprachlicher 
Formen, die sich in der IBK als Mittel der emotionalen und evaluativen Kom- 
mentierung, der Kohärenzsicherung und des spielerischen Rekurses auf Körper- 
lichkeit herausgebildet haben (Emoticons, Inflektive, Adressierungsausdrücke) 
(u. a. Beißwenger et al. 2012). Es gibt kaum Studien, die Aussagen dazu liefern, 
in welchem Umfang derartige Phänomene auftreten, d. h. ob diese für internet- 
basierte Kommunikation tatsächlich repräsentativ sind. 

Aussagen dazu dürften erst möglich sein, wenn wir ein genaueres Bild von 
der Vielfalt des IBK-Haushaltes haben, genauer: seiner Gebrauchsmuster und 
ihrer Nutzung. Für die Analyse des IBK-Haushalts können wir zum Teil auf etab- 
lierte Analysemethoden zurückgreifen, zum Teil erfordert sie neue Ansätze und 
methodische Zugänge. Der vorliegende Beitrag thematisiert die damit verbun- 
denen Herausforderungen. Im Folgenden wird am Beispiel zweier ausgewählter 
IBK-Gebrauchsmuster — thematischer Blogkommentar (Kap. 3.1) und Open- 
Innovation-Portal mit Community-Funktionen (Kap. 3.2) - diskutiert, wie sich 
Eigenschaften des kommunikativen Gebrauchsmusters, seine Einbettung in 
gesellschaftliche Handlungsbereiche (Domänen), das behandelte Thema und 
die Betrachtung von Nutzertypen auf die Methoden der Erhebung, Aufbereitung 
und Analyse von IBK-Daten auswirken. Die Diskussion stützt sich auf den 
„Aachener IBK-Ansatz“ (Kap. 2.2). 
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2 Framework 


2.1 IBK-Gebrauchsmuster 


In den vergangenen zwanzig Jahren hat sich im Zuge der Digitalisierung von 
Kommunikation und durch internetbasierte Technologien ein exponentiell 
schnell wachsender digitaler Kommunikationsraum entwickelt. Betrachtet man 
Phänomene wie das „Internet der Dinge und Services“, Facebook oder „Indus- 
trie 4.0“, ist klar, dass der Übergang von der Informations- zur Webgesellschaft 
zumindest auf dem Wege ist. Für die internet- bzw. webbasierte Kommunikation 
steht inzwischen ein umfangreiches Repertoire von Kommunikationsformen 
und kommunikativen Gebrauchsmustern zur Verfügung. Dieses Repertoire ist 
sozio-ökonomisch, kulturell und historisch-zeitlich geprägt (Jakobs 2011). Die 
zeitliche Prägung ist insofern interessant, als sich die Herausbildung des Reper- 
toires nicht nur außerordentlich schnell vollzog, sondern im Kontext der tech- 
nologischen Entwicklung in einem hohen Tempo und Umfang weiter ausdiffe- 
renziert. Wobei mit Holly (2011) zu fragen wäre, was wen vorantreibt — das 
technisch Mögliche die Herausbildung neuer Kommunikationsformate oder 
neue kommunikative Bedarfe die technologische Entwicklung. Viele Formen 
der internetbasierten Kommunikation sind bislang erst in Ansätzen erforscht 
(Beißwenger 2013), z. B. unter dem Aspekt ihrer Musterhaftigkeit. Ausnahmen 
bilden ältere, etablierte Kommunikationsformen wie E-Mail, Chat oder SMS. 

In Bezug auf den Teil des kommunikativen Haushalts, der durch internet- 
basierte Kommunikation abgedeckt wird, interessieren uns insbesondere As- 
pekte wie Musterhaftigkeit und funktionale Prägung, genauer: (verfestigte) 
kommunikative Gebrauchsmuster als funktional-thematisch bestimmte An- 
wendungsformen von Kommunikationsformen. Wir nutzen den Begriff Kom- 
munikationsform im Sinne von Brinker (2010). Kommunikationsformen (wie 
z.B. Telefonat) sind über situative und mediale Merkmale beschreibbar. Sie 
geben die Rahmenbedingungen der Interaktion mit Gebrauchsmustern vor und 
zeichnen sich durch bestimmte Merkmale aus wie etwa Zeichentyp und Kom- 
munikationsrichtung (ähnlich Dürscheid 2005, die zwischen Kommunikations- 
form und kommunikativer Gattung unterscheidet: „Kommunikationsformen 
bilden den äußeren Rahmen des kommunikativen Geschehens, kommunikative 
Gattungen sind die in der Kommunikation konstruierten Handlungsmuster, die 
den Beteiligten eine Orientierung geben“). 

Gebrauchsmuster sind nach Sandig (1997) konventionalisierte kommunika- 
tive Standardlösungen für wiederholt auftretende, sozial relevante Probleme. 
Die Sprachteilhaber wissen, dass sie bestimmte Probleme und Aufgaben unter 
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bestimmten Bedingungen typischerweise mit bestimmten sprachlichen und 
visuellen Mitteln bearbeiten und so mit anderen Beteiligten in Kontakt treten 
können. Die Bedingungen sind Teil des Handlungstyps. Sie umfassen Faktoren 
wie die Einbettung des Musters in eine bestimmte Domäne (einen gesellschaftli- 
chen Handlungsbereich mit seinen Werten, Normen und Regeln, Brinker 2010) 
als Teil einer sozio-ökonomisch, zeitlich-historisch und kulturell geprägten 
Umwelt und dazugehörigen Handlungssituationen (Jakobs 2011), die dort ver- 
fügbaren technischen Mittel sowie daran gebundene Codes und Modes. Das 
Gebrauchsmuster stellt prototypische Mittel für die kommunikative Bearbeitung 
von Zielen zur Verfügung, wie typische Themen, sprachliche Handlungs- und 
Visualisierungsmuster oder etwa Vorgaben zu Umfängen. 

Die Auseinandersetzung mit IBK-Mustern wird zum Teil durch Zugangs- 
probleme erschwert. So erhalten Forscher eher selten Zugang zu innerbetrieb- 
lich genutzten IBK-Formaten (z.B. Social-Media-Applikationen in Unterneh- 
men). Die IBK-Forschung konzentriert sich deshalb häufig auf privat genutzte 
und/oder öffentlich zugängliche IBK-Gebrauchsmuster; Studien zu professio- 
nellen Nutzungssituationen und Gebrauchsmustern sind vergleichsweise selten 
(u. a. Beißwenger 2013). Die Erhebung von Daten erfolgt in einem wenig gere- 
gelten Rechtsraum. Nach wie vor ist unklar, wer was im Internet erheben darf, 
wie lange IBK-Daten gespeichert werden dürfen und wem sie gehören (vgl. dazu 
Beißwenger et al. in diesem Band). 

Desiderate der Forschung betreffen nicht nur die Erfassung, Beschreibung 
und Modellierung des IBK-Haushalts, sondern auch seine Veränderung. Die 
Beiträge des Handbuchs „Textsorten, Handlungsmuster, Oberflächen. Linguis- 
tische Typologien der Kommunikation“ (Habscheid 2011) diskutieren ausführ- 
lich den aktuellen Forschungsstand - IBK wird dabei nur am Rande behandelt. 
Es ließe sich einwenden, dass die theoretische Auseinandersetzung mit kom- 
munikativen Mustern zeitversetzt zu den Entwicklungen in der Welt erfolgen 
muss; bezogen auf die oben erwähnte Geschwindigkeit der Veränderung digita- 
ler Kommunikationsräume, -formate und -praxen wäre allerdings zu hinterfra- 
gen, was „zeitversetzt“ in diesem Kontext bedeutet. 

Technisch ist inzwischen vieles möglich. Die verfügbaren Tools erlauben 
ein umfangreiches Screening der Spuren medialer Wandelprozesse durch die 
(kontinuierliche) Aufzeichnung von Daten. Schwieriger wird es, wenn es um 
inhaltliche Fragen geht, wie die Unterscheidung und Modellierung von IBK- 
Formen und -Gebrauchsmustern. Im Falle hybrider IBK-Formate’ z.B. fehlen 


1 IBK-Formate, die verschiedene Gebrauchsmuster umfassen bzw. kombinieren. 
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weitgehend adäquate Beschreibungsansätze (vgl. aber Dürscheid et al. 2010, 
Brommer/Dürscheid 2012) wie auch adäquate Methoden der Erhebung, Aufbe- 
reitung und Analyse von Gebrauchsmusterexemplaren. Ähnliches gilt für das 
Erfassen und Beschreiben konkreter Produzenten und Rezipienten als (Sprach-) 
Nutzertypen, die Rekonstruktion von Akteur-Konstellationen oder die Betrach- 
tung des Einflusses situativer Parameter (wie Domänenspezifik oder zeitbezo- 
gene Phänomene, etwa Moden). Wie am Beispiel der Gebrauchsmuster themen- 
spezifischer Blogkommentar und Open-Innovation-Portal mit Community-Funk- 
tion zu zeigen sein wird, ist der Zugang zu den genannten Größen oft nur über 
Umwege möglich. 


2.2 Der Aachener IBK-Ansatz 


Der vorliegende Beitrag stützt sich auf den Aachener IBK-Ansatz. Der Ansatz 
betrachtet internetbasierte Kommunikation aus verschiedenen Perspektiven. 
Die Forschung richtet sich auf 

1. die Beschreibung und Analyse von IBK-Formen und -Gebrauchsmustern 
(z. B. Hypertextmuster, Jakobs 2011; Question-Answer-Systeme und Social 
Media in Unternehmen, Digmayer/Jakobs 2014; Facebook, Wirtz-Brückner 
2015; Blogartikel und -kommentar, Trevisan 2014; Tweet, Korioth 2011) 

2. die Gestaltung, Nutzung und Bewertung von IBK-Gebrauchsmuster 
(-exemplar-)en (Open-Innovation-Plattform mit Community-Funktionen, 
Digmayer/Jakobs 2012a, 2012b, 2012c, Digmayer 2016; Reiseinformations- 
systeme als Self Services, Jakobs 2012, Wirtz/Jakobs 2013, Digmayer et al. 
2015a) 

3. die Analyse von Äußerungen in IBK-Formaten für Zwecke der Technik- 
wahrnehmungs- und der Risikoforschung (u. a. Facebook, Trevisan et al. 
2014, Trevisan/Jakobs 2015; Blogs, Digmayer et al. 2015b). 

4. die Methodenentwicklung für 1-3. 


Die erstgenannte Perspektive schließt die Frage ein, ob und wie vorliegende 
Beschreibungsansätze für Kommunikationsformen und Gebrauchsmuster auf 
IBK-Formate anwendbar sind und welcher Modifikationen sie bedürfen (u.a. 
Jakobs 2003, 2011, Trevisan 2014). Das spezielle Interesse gilt professionellen 
Domänen (Handlungskontexten, -aufgaben und -akteuren). 

Eine wesentliche Voraussetzung für den Vergleich von IBK-Gebrauchs- 
mustern und ihrer Nutzung ist eine aussagekräftige Datenbasis. Teil des Aache- 
ner Ansatzes ist der schrittweise Aufbau eines größeren Gesamtkorpus, das 
Daten verschiedener Forschungsprojekte zusammenführt. Das Gesamtkorpus 
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umfasst nicht nur Korpora zu Gebrauchsmusteranwendungen, sondern auch 
andere Typen von Daten, z. B. Videodaten und Transkripte (aus Nutzertests und 
-interviews). Letztere sind Teil empirischer Studien, die erheben, wie Musterrea- 
lisierungen von Nutzergruppen wahrgenommen und bewertet werden. Die ver- 
balen Spontankommentierungen von Testpersonen, z.B. in kooperativen Auf- 
gabensettings, liefern u.a. Hinweise auf subjektive Theorien (z.B. was als 
typisches Mustermerkmal oder als „angemessenes“ sprachliches und/oder sozi- 
ales Agieren gilt) oder Unterstützungsbedarf bei der Nutzung komplexer IBK- 
Angebote, z.B. Formulierungshilfen für die Kommunikation beruflicher Sach- 
verhalte in unternehmensintern genutzten Social-Media-Applikationen (u.a. 
Digmayer/Jakobs 2014). 

Die Bearbeitung der Forschungsfragen bedingt methodische Entwicklungs- 
arbeit. Die Analyse von IBK-Gebrauchsmustern und ihrer Nutzung (Perspektive 
2) erfolgt in der Regel durch die Kombination qualitativer und quantitativer 
Verfahren der digital gestützten Datenerhebung, -aufbereitung und -analyse, 
durch die Verbindung manueller und digitaler Bearbeitungsschritte und durch 
Methodentriangulation. Die Analyse sprachlich bewertender Äußerungen in 
IBK-Musteranwendungen (Perspektive 3) erfordert die Anreicherung von Text- 
Mining-Verfahren mit linguistischen Verfahren, wie die linguistische Mehrebe- 
nen-Annotation (vgl. Kapitel 3.1). Herausforderungen betreffen u. a. die Inter- 
modalität komplexer IBK-Formate, die bislang nur partiell mit verfügbaren 
Verfahren und Tools zu erfassen und abzubilden ist (vgl. Kapitel 3.2). Teil der 
methodischen Entwicklungsarbeit ist die (Weiter-)Entwicklung digitaler Tools 
(z. B. für die topic detection). 


3 Fallbeispiele 


Die folgende Diskussion von Methoden und Tools der Analyse von IBK- 
Gebrauchsmustern thematisiert exemplarisch am Beispiel zweier Gebrauchs- 
muster (Themenspezifischer Blogkommentar, Kapitel 3.1; Open-Innovation- 
Portal mit Community-Funktionen, Kapitel 3.2) methodische Herausforderun- 
gen der Berücksichtigung von Gebrauchsmuster, Domäne, Thema und Nutzer- 


typ. 
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3.1 Themenspezifischer Blogkommentar 


Das erste Beispiel ist das Gebrauchsmuster „Themenspezifischer Blogkommen- 
tar“ (3.1.1). Im Folgenden wird skizziert, welche Herausforderungen dieses Mus- 
ter an Methoden und Tools der Datenerhebung (3.1.2), -aufbereitung (3.1.3) und 
-auswertung (3.1.4) stellt. 


3.1.1 Kurzbeschreibung des Gegenstands 


Die Kommunikationsform Blog umfasst verschiedene Ausprägungen und Ge- 
brauchsmuster (Blogartikel und Blogkommentar). Die folgenden Ausführungen 
beziehen sich auf thematische Blogs. Thematische Blogs behandeln in der Regel 
exklusiv ein Thema bzw. einen Themenkomplex (z.B. Familie, Religion oder 
erneuerbare Energien). Unser Beitrag fokussiert thematische Blogkommentare 
und Anforderungen an ihre Erhebung, Aufbereitung und Analyse. 

Blogkommentare eröffnen Sprachteilhabern die Möglichkeit, sich zu äußern 
und ihre Äußerung anderen zugänglich zu machen (Trevisan 2014: 43/44). Dies 
kann bezugnehmend auf den Blogartikel und/oder andere Kommentare ge- 
schehen wie auch „frei“ — der Blogger nimmt keinen Bezug auf Vorangegange- 
nes, sondern äußert sich zu einem selbst gewählten Thema (das seinerseits 
wieder Diskussionen auslösen kann, aber nicht muss). Als Motive bzw. Zwecke 
des öffentlichen Kommentierens werden in der Literatur genannt: Dokumentie- 
ren des eigenen Lebens, Ausdruck tief empfundener Emotionen, Ideen verbreiten 
oder Bildung und Aufrechterhaltung von Gemeinschaften (Nardi et al. 2004: 43). 
Je populärer das Thema und je größer die Sichtbarkeit des Blogs (etwa auf 
Grund der Popularität des Betreibers), desto häufiger scheinen Blogartikel 
kommentiert zu werden (Alby 2008). Die Anzahl der Kommentare pro Blogarti- 
kel kann dementsprechend stark variieren. Weitere Unterschiede betreffen das 
Verhalten der Kommentatoren - einige äußern sich sehr häufig, andere dage- 
gen eher selten. Bislang fehlen u. a. Studien, die erheben, wie sich die Posting- 
häufigkeit auf die Art und Weise des sprachlichen Handelns in Blogkommenta- 
ren auswirkt. 

Die folgende Diskussion stützt sich auf Daten des interdisziplinären For- 
schungsprojekts? HUMIC. Die Daten wurden erhoben, um Hinweise darauf zu 


2 HUMIC: „Akzeptanzbewertung als integraler Bestandteil von Entwicklung und Ausbau 
komplexer technischer Systeme. Am Beispiel Mobilfunk“, 2009-2012, gefördert von der Exzel- 
lenzinitiative des Bundes und der Länder. 
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erhalten, wie im Internet bestimmte Technologien (Mobilfunksysteme) von 
Personengruppen wahrgenommen werden, d. h. welche Aspekte der Technolo- 
gie sie thematisieren (Teilthemen) und wie sie diese diskutieren (neutral oder 
wertend). Die Identifizierung, Erhebung und Analyse themenbezogener sprach- 
licher Äußerungen (z. B. in Blogkommentaren) erfolgte mit Text-Mining- 
Methoden. Der Analyse-Fokus richtete sich auf bewertungsindizierende Äuße- 
rungen. Im Folgenden werden am Fallbeispiel ‚Themenspezifischer Blogkom- 
mentar’ Herausforderungen der Erhebung, der Aufbereitung und der Analyse 
thematischer Blogkommentar-Korpora beschrieben. 


3.1.2 Datenerhebung und Korpusbildung 


Die Datenerhebung ist der erste Schritt der maschinellen Verarbeitung natürli- 
cher Sprache; Fehler und Versäumnisse dieser Phase haben weitreichende Kon- 
sequenzen für alle nachfolgenden methodischen Schritte und deren Ergebnisse. 
Der Fokus der Erhebung variiert je nach Forschungskontext. Im vorliegenden 
Beispiel gab das Forschungsprojekt nicht nur einen thematischen Fokus vor — 
es definierte auch den Erhebungszeitraum. Die Datenerhebung und Korpusbil- 
dung unterlag gebrauchsmuster- wie auch domänenbezogenen Herausforde- 
rungen. Sie werden im Folgenden beschrieben: 


Gebrauchsmusterbezogene Herausforderungen 

Eine Herausforderung ist der Aufbau eines repräsentativen Korpus. Aus dieser 
Perspektive sind insbesondere Blogs mit zahlreichen Blogkommentaren interes- 
sant, die jedoch schwierig zu finden sind. Blogs weisen tendenziell weniger 
Kommentare per Artikel auf als z. B. Foren oder Facebook-Themenseiten. Dies 
hat Konsequenzen für den Suchaufwand. Im Fallbeispiel erfolgt die Suche nach 
relevanten Blogs über verschiedene frei verfügbare Suchmaschinen (hauptsäch- 
lich: google.search, google.blogsearch und yahoo). Die Zusammenstellung der 
Keyword-Listen erforderte domänenspezifisches Fachwissen; sie erfolgte in 
enger Zusammenarbeit mit den ingenieurwissenschaftlichen Projektpartnern 
und umfasste Recherchen in der themenbezogenen Fachliteratur. Beispiele für 
themenspezifische deutsche Keywords sind Ausdrücke wie Mobilfunk, Handy, 
Kunde, Funkmast, elektrisches Feld, hochfrequentes Feld oder elektromagneti- 
sches Feld. Die Erhebung fokussiert zwei themenspezifische Blogs als Datenba- 
sis bzw. Ausgangspunkt der Bildung von Textkorpora: www.elektrosmogblog.de 
und www.heise.de/mobil/ (vgl. Tab. 1). 


116 —- Jakobs/Digmayer/Trevisan 


Das Textkorpus www.elektrosmogblog.de umfasst 63 thematische Blogarti- 
kel und 28 Blogkommentare aus dem Zeitraum Mai bis Juni 2008; es hat einen 
Umfang von ca. 6.000 Token. Die Textdaten wurden manuell per Copy&Paste 
erhoben und im txt-Format gespeichert (Trevisan/Jakobs 2010). Das Textkorpus 
www.heise.de/mobil/ umfasst 2.541 Blogartikel und 166.034 Blogkommentare 
aus dem Zeitraum Januar 2008 bis Dezember 2009. Es hat einen Umfang von ca. 
16.000.000 Token; die Textdaten wurden automatisch erhoben und im txt- 
Format gespeichert. Alle in Kapitel 3.1 angeführten Datenbeispiele entstammen 
den genannten Textkorpora. 


Tab. 1: Übersicht zu den themenspezifischen Korpora 


Textkorpus www.elektrosmogblog.de www.heise.de/mobil/ 
Anzahl 
Blogartikel 63 2.541 
Blogkommentare 28 166.034 


Token =6.000 16.000.000 


In HUMIC wurde das Textkorpus www.heise.de/mobil/ kriteriengeleitet in Sub- 

korpora überführt. Genutzt wurden folgende Kriterien: 

— Refinementkriterium 1: Das Kriterium erfasst das Auftreten eines Netzjargon- 
spezifischen Ausdrucksmittels, hier: das Auftreten der interaktiven Einheit 
Emoticon, z.B. als Indikator für Emphase und Bewertungen (vgl. Beiß- 
wenger et al. 2012). Das Subkorpus erfasst nur Blogkommentare, die min- 
destens ein Emoticon enthalten (vgl. Tab. 2). 


Tab. 2: Übersicht Subkorpus | 


Blogkommentare 109 
Token 10.043 


— Refinementkriterium 2: Das Kriterium erfasst den Nutzertyp nach Posting- 
häufigkeit. Für das zweite Subkorpus wurden die Anzahl von Kommentaren 
pro Blogger ermittelt und anhand dieses Wertes Bloggertypen gebildet und 
ausgezeichnet (z. B. Metadatum Nutzertyp I „Blogger mit 1 Kommentar“, 
Metadatum Nutzertyp II „Blogger mit 20 Kommentaren“, etc.). Für jeden 
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Nutzertyp wurden randomisiert 50 Blogkommentare extrahiert und darauf 
bezogen die Tokenanzahl pro Nutzertyp ermittelt (vgl. Tabelle 3). 


Tab. 3: Übersicht Subkorpus II 


Nutzertyp 1 10 20 max. 2 


Token 2.897 3.083 5.362 4.264 15.606 


Die Anordnung von Blogartikel und -kommentar in einem Blog (Blogstruktur) 
kann je nach Content-Management-System variieren, was spezifische Anforde- 
rungen an die Datenerhebung stellt. Das Fallbeispiel umfasst Quellen, die un- 
terschiedlich strukturiert sind: in www.elektrosmogblog.de erfolgt die Listung 
der Blogkommentare direkt unter dem Artikel in antichronologischer Reihenfol- 
ge (der neueste Beitrag erscheint oben); im Falle von www.heise.de/mobil/ sind 
die Blogkommentare zu einem Artikel nur über einen Link erreichbar. Die struk- 
turellen Unterschiede erhöhen den Aufwand der semi- wie auch der voll- 
automatischen Datenerhebung. Die Erhebungsmethode muss blogabhängig 
angepasst bzw. modifiziert werden. Wer mehrere Blogs zugleich erheben will, 
benötigt ein dementsprechend breites Wissen um Strukturierungsprinzipien. 
Bei einer Grundmenge von 100 Blogs muss die Struktur von 20% der Blogs be- 
kannt sein, um den Crawler so trainieren zu können, dass er 80% der Blogs 
findet und dort enthaltene Texte (z. B. Blogkommentare) zuverlässig extrahiert 
(80/20 principal, Koch 2011). Ist das 80/20-Prinzip nicht gesichert, treten Fehler 
auf: Texte werden nicht identifiziert und fehlen in der erfassten Textmenge, sie 
werden nur zum Teil erkannt und dann unvollständig extrahiert oder es werden 
mit dem Text nicht-analyserelevante Anteile erhoben (z. B. Ankertexte). Im Falle 
großer Textkorpora potenzieren sich Fehler über die weiteren Verarbeitungs- 
schritte, da manuelle Korrekturen und Korpusüberarbeitungen nur stichpro- 
benartig möglich und damit bedingt hilfreich sind. 

Eine weitere Herausforderung der Datenerhebung ergibt sich aus der poten- 
tiell begrenzten Verweildauer von Blogs im Netz. Blogs können aus dem Netz 
„verschwinden“, etwa wenn der Autor aus persönlichen Gründen den Blog 
schließt oder wenn der Betreiber feststellt, dass das Blogthema nicht mehr öf- 
fentlichkeitsrelevant ist. In diesem Fall kommt der von Hyperlink zu Hyperlink 
suchende Crawler zu einem Punkt, an dem der Suchprozess automatisch ab- 
bricht. Wiederholte Datenerhebungsabfragen, etwa infolge veränderter Frage- 
stellungen, sind nach dem Verschwinden von Blogs nicht mehr möglich. 
Datenerhebungsverfahren, die auf zeitbezogene Phänomene abheben (z.B. 
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Trendanalysen) und daher iterative Abfragen erfordern, müssen aus den ge- 
nannten Gründen regelmäßig in kürzeren Abständen erfolgen. Dies erhöht den 
personellen Aufwand. 

Das Ziel, Korpora verschiedener Forschungsprojekte für spätere For- 
schungsfragen zusammenzuführen (z. B. für Einzelkorpora übergreifende Ana- 
lysen), bedingt die Entwicklung eines möglichst leistungsfähigen Konzepts für 
die Datenbenennung und Langzeitspeicherung, das sich an Anforderungen wie 
Eindeutigkeit, Flexibilität, Nachhaltigkeit und Aufwand orientiert. Eine Grund- 
anforderung an die Archivierung ist die originäre Sicherung der im Internet 
erhobenen Daten; sie werden „unbereinigt“, d.h. vollumfänglich (inklusive 
Kontext- und Menüelemente, Navigationslinks, Metadaten etc.) gespeichert. 
Das Verfahren bietet den Vorteil, dass bei sich veränderndem Forschungsfokus 
Seitenelemente, die im Augenblick der Datenerhebung nicht analyserelevant 
erschienen, berücksichtigt werden können. Parallel oder alternativ dazu kön- 
nen bzw. sollten - wie beim Fallbeispiel (vgl. Kap. 3.1.3) - die erhobenen Daten 
bereinigt (d. h. ohne Zusatzinformationen wie z. B. Ankertexte) in einem reinen 
Textformat (z. B. .txt) abgespeichert werden, um das Korpus bei Bedarf in ver- 
schiedene Formate (z. B. .exb) überführen zu können. 

Der Aufbau eines Gesamt-Korpus, das verschiedene Korpora integriert, er- 
fordert eine einheitliche, eindeutige und nachhaltige Benennungssystematik, die 
Hinweise auf die Textquelle, das Erscheinungsjahr und das Gebrauchsmuster 
liefert, z. B. „Blogname_Jahr_durchlaufende Nummer.txt“. Das Verfahren wur- 
de im Fallbeispiel auf die erhobenen Daten angewandt (z.B. Hei- 
se2009_000019651.txt). Alternativ kann das tatsächliche Erscheinungsdatum 
(des Datums) die fortlaufende Nummerierung ersetzen. 


Domänenbezogene Herausforderungen 

Aufgaben wie Langzeitarchivierung und Speicherung erfordern die Klärung 
rechtlicher Fragen. IBK-Forschung setzt den freien und/oder lizenzierten Zugriff 
auf Korpora voraus, Regeln für den Zugang zu Plattformen und wissenschaftli- 
chen Communities und/oder das Einverständnis des „Datenbesitzers“ (Autors, 
Betreibers eines Dienstes etc.). Die Praxis sieht häufig anders aus. Die Erhebung 
von Daten in Unternehmenskontexten (z.B. firmenintern genutzte Applikatio- 
nen) bedingt in der Regel langwierige Klärungsprozesse mit der Unternehmens- 
leitung (eine wesentliche Voraussetzung ist die Zustimmung des Personalrates); 
häufig müssen die erhobenen Daten nach einem vereinbarten Zeitraum gelöscht 
werden. Die Freigabe von Daten für die Scientific Community ist generell prob- 
lematisch. Die beschriebenen Probleme sind ein wesentlicher Grund für die 
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geringe Anzahl linguistischer oder kommunikationswissenschaftlicher Studien 
zu diesem Bereich der IBK-Nutzung. 

In öffentlichen Domänen ist die Erhebung scheinbar unkompliziert — die 
Daten werden öffentlich oder halb-öffentlich produziert und rezipiert, was die 
Annahme nahelegt, dass jeder Forscher diese Daten für seine Zwecke erheben 
und nutzen darf. Tatsächlich bewegt sich hier IBK-Forschung in einer rechtli- 
chen Grauzone. Äußerungen auf Facebook-Seiten und in anderen Social-Media- 
Umgebungen gehören den Betreibern und den Verfassern, deren Einverständnis 
einzuholen wäre, was praktisch aber kaum möglich ist’. Infolgedessen ist die 
Bereitstellung aufbereiteter Textkorpora für den Download und die Datenanalyse 
durch Dritte (z. B. auf forschungsnahen Plattformen wie CLARIN) bisher recht- 
lich nicht eindeutig geklärt. Fragen, die sich in diesem Kontext ergeben, lauten 
u.a.: Wie sichere ich Daten für Forschungszwecke (auf einem Einzel-PC, in 
einer Netzwerkumgebung mit Zugang für andere Forscher)? Wer darf auf was 
Zugriff haben? In welchem Umfang darf ich Daten zur Wiederverwendung Drit- 
ten anbieten? Die aktuelle Rechtslage hat auf diese Fragen nur bedingt Antwor- 
ten; die anhaltenden Diskussionen zeigen, dass bislang keine abschließende 
Klärung in Sicht ist.* 


3.1.3 Datenaufbereitung 


Die Datenaufbereitung unterlag im Fallbeispiel gebrauchsmuster- und nutzer- 
typbezogenen, themen- und domänenbezogenen Restriktionen. 


Gebrauchsmusterbezogene Herausforderungen 

Das Gebrauchsmuster schafft unterschiedliche Ausgangsbedingungen für die 
Datenaufbereitung (etwa die Bereinigung der Daten und die Anreicherung von 
Text mit Metadaten, PoS-Tags und Mehrebenen-Annotation). Vom Gebrauchs- 
muster ist u. a. abhängig, ob die Musterrealisierung Hinweise auf Autor, Quelle 
und Veröffentlichungsdatum liefert, die als Metadaten in die Datenaufbereitung 
eingehen können (Datenanreicherung). Die Qualität und/oder die Art und Wei- 


3 Die Ausführungen beziehen sich auf einen Vortag von Nikolaus Forgó zum Thema auf der 5. 
Arbeitstagung des DFG-Netzwerks Empirikom an der Universität Hamburg (25.-26.04.2013). 

4 Siehe aber Beißwenger et al. (in diesem Band), die über ein Rechtgutachten zur Bereitstel- 
lung des Dortmunder Chat-Korpus in CLARIN-D und die daraus resultierenden Konsequenzen 
für die Datenaufbereitung und -repräsentation berichten. 
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se dieser Hinweise entscheiden maßgeblich, ob und wie sie für Metadaten ge- 
nutzt werden können und wie belastbar darauf basierende Analyseergebnisse 
sind. So hat typischerweise jeder Blogkommentar einen Autor, der häufig je- 
doch nicht anhand des im Blog genannten Autorennamens rekonstruierbar ist, 
da viele Autoren ihre Identität hinter einem Nickname verbergen und/oder über 
Nicknames eine neue Identität schaffen (Bolander 2013: 80). Die Auswertung 
erlaubt daher nur selten Hinweise auf soziale Gruppen. Dies ist im Falle von 
Social-Networking-Sites (SNS) anders. Hier hinterlassen die Nutzer typischer- 
weise sozio-demographische Daten zu ihrer Person (Trevisan et al. 2014). Her- 
ausforderungen betreffen hier eher die automatische Erhebung dieser Daten, da 
SNS-Anbieter wie Facebook ihre Nutzer partiell vor externem Datenmissbrauch 
schützen, z. B. indem sie Ausleseverfahren abbrechen. 

Der Einfluss des Gebrauchsmusters zeigt sich besonders deutlich auf der 
Ebene des Part-of-speech-Tagging (PoS), des Auszeichnens mit morpho- 
syntaktischen Kategorien. Bestimmte Gebrauchsmuster, z.B. Zeitungsartikel, 
folgen weitgehend den Normen des schriftsprachlichen Standards (Trevisan 
etal. 2013a), weshalb sie gern zum Training von Tools genutzt werden. Von 
Nutzern verfasste Beiträge, wie z.B. Blogkommentare, variieren dagegen je 
nach Gebrauchsmuster zum Teil stark — das Spektrum der eingesetzten Mittel 
reicht von einem stark schriftsprachlich orientierten Duktus bis hin zu mehr 
oder weniger stark (und intendiert) davon abweichenden Ausdrucksformen 
(wie etwa fehlende Interpunktion, elliptische Sätze, Netzjargon). Die Abwei- 
chungen müssen auf der morpho-syntaktischen Annotationsebene abgebildet 
werden, z.B. durch das PoS-Tagging von interaction signs (Beißwenger etal. 
2012 in IBK-spezifischer Erweiterung des Konzepts der ‚interaktiven Einheiten’ 
aus Zifonun et al. 1997). Herausforderungen betreffen insbesondere die Adapti- 
on bestehender Tools und Annotationsschemata für Social-Media-Texte. Aktuel- 
le Entwicklungen zur Adaption gängiger Tagger für PoS-Tagging verfolgen zwei 
Verfahrensweisen: (i) das dem Tagger zugrundeliegende Tagset wird durch Tags 
für die Auszeichnung Netzjargon-spezifischer Mittel und Ausdrücke erweitert 
und die Daten werden mit dem erweiterten Tagset ausgezeichnet (Bartz et al. 
2013); (ii) die Verwendungsregeln des bestehenden Tagsets werden für die Aus- 
zeichnung Netzjargon-spezifischer Mittel und Ausdrücke modifiziert bzw. er- 
weitert und anschließend Daten anhand der neu definierten Tagsets annotiert 
(WebTagger; Neunerdt et al. 2013a,b). 

Social-Media-basierte Gebrauchsmuster erfordern bei der Mehrebenen- 
Annotation (Trevisan 2014) Anpassungen auf allen linguistischen Ebenen. Sie 
betreffen u. a. die Annotation von Tilgungen und Klitisierungen (morphologi- 
sche Ebene), von interaktiven Einheiten und onomatopoetischen Ausdrücken 
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(graphematische Ebene) oder etwa von Formen des IRONISIERENs (pragmati- 
sche Ebene). Ihre Verarbeitung - z.B. für Zwecke der Sentiment Analysis - 
bedingt spezifische Verfahren der Annotation und Auswertung, die bisher erst 
in Ansätzen existieren (Trevisan 2014). 


Nutzertypbezogene Herausforderungen 

Die Bestimmung und Identifikation von Nutzertypen erfordert Kriterien, die je 
nach Forschungsinteresse variieren. Eine Forschungsintention könnte z.B. 
sein, Nutzertypen anhand des Aktivitätspotentials zu bestimmen und in einem 
zweiten Schritt zu prüfen, ob und wie sich das Aktivitätspotential auf das 
sprachliche und/oder soziale Verhalten auswirkt. Das Aktivitätspotential erfasst 
zum Beispiel, wie häufig jemand in den erhobenen Blogs Kommentare postet 
(dies setzt voraus, dass er denselben „Namen“ verwendet). Die Kommentie- 
rungsfrequenz wird in diesem Fall zum Metadatum. Im Fallbeispiel zeigte sich 
u. a., dass häufig kommentierende Nutzer hohe Anforderungen an Qualitätskri- 
terien wie Sachlichkeit und sprachliches Ausdrucksvermögen stellen und dem- 
entsprechend agieren (vgl. auch Neunerdt et al. 2011). Nutzer mit einem gerin- 
gen Aktivitätspotential zeichnen sich im Vergleich dazu häufig durch 
sprachliche Abweichungen von der Norm aus und werden dann ggf. von erfah- 
renen (hochfrequenten) Kommentierenden zurechtgewiesen. Dazu zwei Bei- 
spiele: 

Zitat 1: „Doppelt gemoppelt? Entweder "beim" oder "bei dem" oder? Jaja, 
ich bin gut, ich habe einen Grammatikfehler im Artikel gefunden und fühle 
mich nun auch besser... Es ist Sonntag, steinigt mich^^ wenn ich mir den roten 
Balken so ansehe, scheint das zu funktionieren :-D, besser als manches Getue! 
Aber Du hast recht, ich finde solche Fehler viel zu häufig, um noch daran glau- 
ben zu können. dass sich Autoren Mühe gebe. (auf meiner Site gibts auch ge- 
nug, da bin ich sicher :-)) 

Zitat 2: Da man im Glashaus nicht mit Steinen werfen sollte, finde ich aber 
dort auch noch Unverständlichkeiten: "Ich mecker echt ungern über textliche 
Fehler, aber deine Grammatik sind ja mal unter aller Sau." Es gibt noch viele 
Legastheniker auf der Welt, und man sollte es denen nicht zum Vorwurf ma- 
chen. Ich mache auch viele Rechtschreibfehler. Naja, der Originaltext beinhalte- 
te irgendwas mit 'Höherer Umsatz verursachen höhere Kosten.' Jetzt solltest du 
auch meinen "Fehler" verstehen ^^. Und der ursprüngliche Satz hat nichts mit 
Legasthenie zu tun, sondern ganz einfach mit falscher Grammatik. 

Eine andere Möglichkeit der Nutzertypbildung ist die Einordnung anhand 
von Einstellungstendenzen. In HUMIC erfolgte sie über die manuelle Ermittlung 
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von Polaritätsindizes der veröffentlichten Beiträge (positive vs. negative Ge- 
samttendenz der Blogkommentare). Die Herausforderung ergibt sich bei diesem 
Ansatz in der Behandlung divergierender methodischer Anforderungen: die 
Einordnung eines Nutzers nach Einstellungstendenz erfordert eine ausreichend 
hohe Anzahl von Äußerungen, die Handhabbarkeit des Ansatzes (da manuell) 
dagegen eine möglichst geringe Menge. 


Themen- und domänenbezogene Herausforderungen 

Bei der Datenaufbereitung für Blogkommentare werden themenspezifische 
Begriffe zu Wortfeldern gruppiert (klassifiziert). Die Wortfelder bilden Einträge 
in themenspezifischen Lexika, die später z.B. für Frequenz- oder Sentiment- 
Analysen (vgl. Datenanalyse) genutzt werden. Herausforderungen ergeben sich 
aus der Art der Erstellung von Wortfeldern. Im Fallbeispiel wurden Begriffe aus 
dem Material extrahiert und zu Wortfeldern zusammengestellt. Die Domänen- 
spezifik des Themas erschwert u.a. das Erkennen von Über- und Unterord- 
nungsrelationen, von Synonymen und Antonymen etc. Das fehlende Wissen 
muss durch Nachfragen bei Experten oder Recherchen in Fachtexten gedeckt 
werden, was den zu betreibenden Aufwand deutlich erhöht. 


3.1.4 Datenanalyse 


In der Phase der Datenanalyse des Fallbeispiels dominierten gebrauchsmuster-, 
nutzertyp- und themenbezogene Anforderungen die methodische Umsetzung. 


Gebrauchsmusterbezogene Herausforderungen 

Die Analyse von Blogkommentaren dient im Fallbeispiel der Ermittlung von 
Einstellungen und Polaritäten der öffentlichen Diskussion zu einem bestimmten 
Thema (hier: Mobilfunk). Sie erfolgt auf Basis der in Kapitel 3.1.3 beschriebenen 
Mehrebenen-Annotation. Im Mehrebenen-Annotationsmaterial wird untersucht, 
welche sprachlichen Indikatoren bzw. Mittel in welcher Kombination eine 
sprachliche Bewertungshandlung indizieren. Zu diesem Zweck werden statisti- 
sche Methoden sowie Verfahren der Mustererkennung angewandt (z. B. Support 
Vector Machine). Herausforderungen betreffen unterschiedliche Aspekte: Zum 
einen hängen sprachliche Muster des Bewertens in hohem Maße vom jeweiligen 
Gebrauchsmuster ab (z.B. Gutachten vs. Blogkommentar). Der Grad der Mus- 
terhaftigkeit sprachlichen Bewertens ist umso höher, je normkonformer sprach- 
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liche Realisierungsmuster sind (Ich finde, dass das lächerlich ist. vs. LOL); ihre 
Beschreibung und automatisierte Identifikation und Analyse wird dadurch 
erheblich erleichtert. Zum anderen hängt der Grad der Musterhaftigkeit sprach- 
lichen Bewertens von der realisierten Sprachhandlung ab: Die Identifikation 
und Beschreibung sprachlicher Indikatoren, die die Bewertungshandlungen 
RHETORISCHES FRAGEN oder IRONISIEREN konstituieren, unterscheiden sich 
wesentlich in ihrer Eindeutigkeit und Auftretenshäufigkeit (Trevisan 2014). 


Nutzertypbezogene Herausforderungen 

Die Möglichkeiten der Bestimmung von Nutzer- bzw. Akteurprofilen (Akteur- 
Analyse) und ihre Berücksichtigung in der Analyse hängen wesentlich von dem 
jeweiligen Gebrauchsmuster und der Domäne ab. In vielen Fällen werden Ge- 
brauchsmuster anonym genutzt (z.B. Blogkommentar), andere Muster erfor- 
dern konkrete Angaben zur Person des sich Äußernden (z. B. Facebook). Gleich- 
zeitig kann die Domäne die Vollständigkeit von Nutzer-Profilen einschränken, 
z.B. im Falle von Intranet-Blogs oder geschlossenen Facebook-Gruppen. Die 
Aussagekraft von Nutzerprofilen variiert damit abhängig von der Zugänglich- 
keit sowie der Qualität und Quantität der im Netz zu ermittelnden Nutzerdaten. 


Themenbezogene Herausforderungen 

Im Fallbeispiel wird bei der Datenanalyse wortfeldbezogen (Kap. 3.1.3) ermittelt, 
welche Begriffe (z. B. Mast, Strahlen, Handy) wie gewichtet sind. Die Ermittlung 
der Auftretenshäufigkeit erfolgt über Frequenz-Analysen; sie erlauben Aussa- 
gen über Themen- und Bewertungsschwerpunkte der im Netz geführten Diskus- 
sion zu einem Thema (Trevisan/Jakobs 2012: 198/199). Herausforderungen erge- 
ben sich insbesondere durch Wortfeldbegriffe, die nicht im Schritt der 
Datenaufbereitung erfasst wurden (unbekannte Synonyme oder Wortneuschöp- 
fungen, z. B. Apfel-Phone statt iPhone) und dementsprechend bei der Datenana- 
lyse unberücksichtigt bleiben. Die daraus resultierenden Lücken wirken sich 
nachteilig auf nachgelagerte Analysemethoden, z.B. Trend-Analysen, aus, die 
auf frequenzanalytischen Voruntersuchungen basieren. Trend-Analysen erhe- 
ben, wie sich die Wahrnehmung und Bewertung eines Themas und seiner 
Merkmale im zeitlichen Verlauf verändern (Trevisan et al. 2013b). Sie können 
zurückliegende Entwicklungen über die Zeit rekonstruieren, Veränderungen der 
öffentlichen Diskussion und ihrer Themenschwerpunkte zu einem Themenbe- 
reich aufzeigen sowie Zeitpunkte und Verschiebungen in der öffentlichen 
Wahrnehmung und Bewertung eines Themas aufdecken. Werden Themenbe- 
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griffe nicht erfasst, verschieben sich Themengewichtungen. Aussagen, die sich 
aus diesen Ergebnissen ableiten, bilden Diskussionen im Internet nicht adäquat 
ab und können (insbesondere in anwendungsnahen Kontexten) zu falschen 
Implikationen führen. 


3.2 Open-Innovation-Portal 


Das zweite Beispiel ist das Gebrauchsmuster „Open-Innovation-Portale mit 
Community-Funktionen“ (3.2.1). Im Folgenden wird skizziert, welche Heraus- 
forderungen dieses an sich komplexe Muster an Methoden und Tools der Daten- 
erhebung (3.2.2), -aufbereitung (3.2.3) und -auswertung (3.2.4) stellt. 


3.2.1 Kurzbeschreibung des Gegenstands 


Open-Innovation-Portale sind digitale, plattformbasierte Gebrauchsmuster, die 
an die kommunikative Funktion der Ideengenerierung und -entwicklung ge- 
knüpft sind. Unternehmen setzen Open-Innovation-Portale in Innovationspro- 
zessen ein, um Ideen von „außen“ (z. B. von Kunden, Tüftlern und Experten) zu 
erhalten, die für die Entwicklung neuer Produkte und Services genutzt werden. 
Das Konzept der Open Innovation (OI) öffnet den firmeninternen Innovations- 
prozess, indem er gezielt potentielle Kunden als Wissensressource in den Ent- 
wicklungsprozess einbindet. 

Zu den Methoden des Open-Innovation-Ansatzes gehören so genannte In- 
novationswettbewerbe. In diesen werden die Teilnehmer aufgefordert, in einem 
festgelegten Zeitraum zu einem bestimmten Problem bzw. einer ausgelobten 
Aufgabe Ideen zu entwickeln und einzureichen. Ziel des Verfahrens ist das 
Sammeln von Bedarfs- und/oder Lösungsinformationen für neue Produkte und 
Services. Die besten Ideen werden nach Ablauf der Einreichungsfrist durch eine 
Jury oder Peer Reviews ermittelt und honoriert (Hallerstede/ Bullinger 2010). 
Innovationswettbewerbe können offline oder online erfolgen; online werden sie 
als Open Innovation Portal (OIP) realisiert. OIP unterscheiden sich von offline 
durchgeführten Wettbewerben durch die Möglichkeit der Integration von Com- 
munity-Funktionen. Community-Funktionen ermöglichen den Teilnehmern die 
Bewertung eingereichter Ideen (Vorselektion der besten Ideen) wie auch ihre 
diskursive Weiterentwicklung (Co-Creation), z. B. durch Kommentierung oder 
den Austausch von Nachrichten. Der Erfolg von Open-Innovation-Portalen mit 
Community-Funktionen (COIP) hängt u. a. davon ab, wie es gelingt, Personen 
zum Einreichen von Ideen zu motivieren und eine aktive Community aufzubau- 
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en. Die Nutzer der Plattform können auf der Plattform verschiedene Rollen ein- 
nehmen: einige reichen nur Ideen ein, andere beschränken sich auf das Kom- 
mentieren von Ideen, wieder andere übernehmen beide Rollen. 

Die folgende Diskussion stützt sich auf Daten, die in dem interdisziplinären 
Verbundprojekt Offene Innovationsplattform für altersbezogene Dienstleistungen 
(OpenISA) erhoben wurden. Im Projekt wurden vier Open-Innovation- 
Wettbewerbe als Portale durchgeführt. Das im Folgenden diskutierte Fallbei- 
spiel bezieht sich auf das Open-Innovation-Portal Einfach Telefonieren, das als 
Wettbewerbsidee die Entwicklung eines „Senioren-Mobiltelefons der Zukunft“ 
auslobt und dabei dezidiert ältere Teilnehmer als Ideengeber und Kenner der 
Zielgruppe adressiert. 

Das Portal Einfach telefonieren bietet verschiedene Typen von Funktionen 
an (vgl. Abb. 1 unten): System-bezogene Funktionen für die Anmeldung auf der 
Plattform und die Registrierung im Wettbewerb, die Wettbewerb-bezogene 
Funktion „Ideen einreichen“ sowie Community-bezogene Funktionen, die par- 
tizipative Handlungen ermöglichen, wie das Bewerten und Kommentieren von 
Ideen, Selbstdarstellung (über Profile) und den Austausch untereinander 
(Nachrichten). 


© © Funktionen 
— 1 Registrierung a 
2 Login } system bezogen 
3 Ideeneingabe - Wettbewerb-bezogen 


4 Ideenbewertung 

5 Ideenkommentierung 

6 Nachrichten Community-bezogen 
7 Profile 

8 Nutzerprofil 


we 


Abb. 1: Funktionen des COIP Einfach Telefonieren 


5 Gefördert im Ziel 2-Programm des Bundeslandes NRW aus Mitteln der Europäischen Union: 
Europäischer Fonds für regionale Entwicklung - Investition in unsere Zukunft. 
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Die Funktion „Ideen einreichen“ unterstützt verschiedene Formate der Ideen- 
eingabe bzw. -entwicklung (Abb. 2). 


Schritt 1: Geben Sie Ihrer Idee ein Bild und einen Titel 


Bild: Titel der Idee* 
[0] (max. 200 Zeichen) 


Beschreibu! 


Ey 


noch kein Bild vorhanden 


Bild hochladen 
(Format: optimal 275x275 Pixel) 
(JPG, GIF, PNG max. 10MB) 


weiteres Bild hochladen Was ist das Besondere an Ihrer Idee* 
(JPG, GIF, PNG max. 10MB) 


weitere Anhän; hochladen 
MOV, MP(E)G max. 10MB) 


* Diese Felder sind Pflicht 


Schritt 2: Wählen Sie eine Kategorie zu Ihrer Idee ein 
© Design 

© Bedienbarkeit 

© Zubehör 

© Services 

© Funktionen 

© Gesundheitsdienstleistungen 


Schritt 3: Bitte bewerten Sie Ihre Idee anhand der folgenden Bewertungskriterien 


Die Idee finde ich... schlecht ie * * * * gut 
Wie gut ist die Idee? 

Die Idee würde ich... nicht kaufen ie “ * te * kaufen 
Würde ich dieses Produkt kaufen? 


Idee einreichen 


Abb. 2: Eingabeformular für Ideenbeschreibungen 
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1. Die Wettbewerbsteilnehmer können ihre Idee schriftlich beschreiben und 
mit Hilfe eines Eingabeformulars hochladen (vgl. Abb. 2). Das Eingabefor- 
mular strukturiert die Ideen-Beschreibung durch die Eingabefelder Titel, 
Beschreibung sowie Besonderheiten. Optional kann der oder die Einreichen- 
de die Angaben des Eingabeformulars durch das Hochladen weiterer Datei 
(-typ-)en ergänzen (Dateien mit Abbildungen, Präsentationsfolien, Tabel- 
lenkalkulationen oder Videos). Er bzw. sie wird abschließend gebeten, die 
eingereichte Idee thematisch einzuordnen. Die Einordnung erfolgt anhand 
vorgegebener Kategorien (im Fallbeispiel: Aspekte von Mobiltelefonen wie 
Design, Bedienbarkeit, Zubehör, Services, Funktionen und Gesundheitsleis- 
tungen). 

2. Die Wettbewerbsteilnehmer können ergänzend oder alternativ mit Hilfe 
eines interaktiven Baukastensystems (Toolkit) - dem Handy-Konfigurator — 
Designvorschläge entwickeln und einreichen (vgl. Abb. 3). Teil des Ge- 
brauchsmusters ist damit eine spezifische Form maschineller Interaktivität: 
Der Konfigurator bietet verschiedene Gestaltungskomponenten und 
-varianten an. Die „Entwickler“ können Komponentenausprägungen aus- 
wählen und per Drag&Drop für die Entwicklung eines Handy-Designs nut- 
zen. Über zwei Texteingabefelder im Toolkit (Titel und Beschreibungstext) 
können die Nutzer den Designvorschlag ergänzend verbal beschreiben. 


. Handytyp 
Funktionen: Ihr Handy: Handyfarbe 


Tastatur 


Vorderseite Rückseite 


Zierelemente 
Textgravur 
Funktionen 

Titel & Beschreibung 


dee einreichen 


Abb. 3: Das Toolkit „Handy-Konfigurator“ 


128 — Jakobs/Digmayer/Trevisan 


Das Gebrauchsmuster weist methodisch relevante Besonderheiten auf. Sie be- 
treffen den „Lebenszyklus“ des Portals und des ausgelobten Wettbewerbs, die 
Darstellungsmöglichkeiten für Ideen, das integrierte Toolkit sowie die Interakti- 
on in der Community. Im Fallbeispiel richtete sich das Forschungsinteresse auf 
den Zusammenhang von Gestaltungsmerkmalen der Plattform und Nutzerver- 
halten (Welche Funktionen werden wie genutzt? Wie wirkt sich die Gestaltung 
einer Funktion auf die Nutzung aus? Wo benötigen die Nutzer Unterstützung? 
Wie interagieren die Community-Mitglieder?). Die Ergebnisse wurden u.a. für 
die Ableitung von Gestaltungshinweisen für derartige Wettbewerbe genutzt. 


3.2.2 Datenerhebung 


Im Fallbeispiel wurde eine integrative Methodik genutzt: Um Hinweise auf die 
tatsächliche Nutzung zu erhalten, wurde die Nutzung der realen Plattform er- 
fasst. Um festzustellen, wie Teile des Gebrauchsmusters und seiner Realisierung 
von Nutzergruppen (z. B. der Zielgruppe Senior-Experte) wahrgenommen wer- 
den, wurden Nutzertests durchgeführt. 

Aufzeichnung von Aktivitäten auf der Plattform: Das Forschungsinteresse 
richtete sich im Fallbeispiel auf eine möglichst umfassende Abbildung der Por- 
talnutzung (sprachliche und nicht-sprachliche Aktivitäten). Die Daten müssen 
aus der Plattform selbst gewonnen werden. Forscher haben in der Regel keinen 
Zugriff auf die Erfassungs- und Verwertungsformen der den Wettbewerb betrei- 
benden Unternehmen. Im Fallbeispiel wurden die Nutzeraktivitäten bezogen 
auf die Hauptfunktionen (vgl. Abb.1) durchgängig (ab Wettbewerbsbeginn) als 
Logfiles aufgezeichnet; die eingestellten Inhalte (Ideenbeschreibungen, Kom- 
mentare und Nachrichten) wurden extrahiert und offline verfügbar gemacht. 
Die Aufzeichnung der Logfiles war im Fallbeispiel Teil der Forschungsvereinba- 
rungen mit den Partnerunternehmen (d. h. den auslobenden Firmen und dem 
Portalbetreiber). 

Die Extraktion der nutzergenerierten Inhalte ist sehr aufwändig. Im Fallbei- 
spiel wurde das Portal „Seite für Seite“ durchgesehen; die Nutzerbeiträge 
(Ideenbeschreibung, Kommentare, etc.) wurden manuell identifiziert und auf 
einem Speichermedium abgelegt. Die manuelle Erhebung ist notwendig, wenn 
— wie im Fallbeispiel — die Seiten per Javascript erzeugt werden. Die Extraktion 
ist je nach Datenbestand zeit- und arbeitsintensiv: das Portal Einfach telefonie- 
ren enthält mehrere Hundert Ideen; jede Idee wird auf einer eigenen Unterseite 
mit den dazugehörigen Bewertungen und Kommentaren dargestellt. 
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Themenbezogene Herausforderungen 

Ein Thema (z. B. eine eingereichte Idee) kann in verschiedenen Datei-Formaten 
(.JPG, .GIF, .PNG, .DOC(X), .PDF, .PPT(X), .XLS(X), .AVI, .WMV, .MOV, .MP(E)G) 
beschrieben und eingereicht werden (vgl. Abb. 4). Zu den Herausforderungen 
der Datenerfassung gehört, alle zu einer Idee gehörenden Dateien vollständig 
zu erfassen. 


Idee-Beschreibung 


Titel: 
„Vitalfunktions- 
überwachung” 


Beschreibung: 
„Das Handy als 
Multifunktions- 
computer kann 
ärztliche Über- 
wachung verein- 
fachen. [...]” 


Modalität: Modalität: Modalität: 
Verbal Visuell Visuell 


Abb. 4: „Verteilte“ Themen (splitted topics) 


Je nach Gegenstandsbereich (Ideen für Handy-Design, -Funktionen, -Services) 
präferieren die Teilnehmer eher eine Modalität (textuelle, visuelle, interaktive 
Darstellung) oder eher ihre Kombination. Während Textteile im Browser relativ 
einfach mit der Option „Seite speichern unter...“ heruntergeladen werden kön- 
nen, vergrößert die Sammlung von Bildern, Videos und Dokumenten den Erhe- 
bungsaufwand deutlich. Einige Dateiformate lassen sich nur mit Mehraufwand 
(z. B. manuelles Herunterladen von Dokumenten), andere nur mit Hilfslösun- 
gen erfassen (z. B. Abfilmen von Videos). 
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Gebrauchsmusterbezogene Herausforderungen 
Die Erhebung des COIP-Datenbestands unterliegt zeitlichen Restriktionen. Wird 
das Portal nach Wettbewerbsende aus dem Netz genommen (offline geschaltet), 
ist der Zugriff nicht mehr möglich. Ideal wäre, den Prozess der Erzeugung von 
Inhalten kontinuierlich erfassen zu können, was in der Regel nicht machbar ist. 
Eine (im Fallbeispiel praktizierte) Alternative ist die punktuelle, zeitlich be- 
grenzte Extraktion von Inhalten, die in einem engen Zeitkorridor kurz vor Wett- 
bewerbsende erfolgen muss, um Ansprüchen zu genügen wie Datenreichtum 
(möglichst viele eingestellte Nutzerbeiträge) und Vermeiden von Datenlücken 
(möglichst wenige nicht erfasste Beiträge). Wesentlich ist ein gutes Erhebungs- 
konzept; Erhebungsfehler können im Nachhinein kaum kompensiert werden. 
Das im COIP Einfach Telefonieren erhobene Datenkorpus umfasst 372 Ideen 
(268 textuell beschriebene Ideen und 104 mit dem Toolkit produzierte Baukas- 
ten-Ideen). Zu den Ideen wurden 713 Kommentare abgegeben - 581 zu textuel- 
len Ideenbeschreibungen, 132 zu Baukastenideen (vgl. Tab. 4, unten). 


Tab. 4: Daten-Übersicht COIP Einfach Telefonieren 


Textuelle Baukasten-Idee Gesamt 
Ideenbeschreibung 


Ideen (Anzahl) 268 104 372 
Kommentare 581 132 713 
(Anzahl) 


Nutzertypbezogene Herausforderungen 

Hinweise auf Nutzerdaten liefert die Logfile-Registrierung von Zugriffen auf die 
Unterseiten des Portals. Sie erfordert - wie erwähnt - die Zustimmung des Por- 
talbetreibers. Bei der Logfileregistrierung werden automatisiert die IP-Adresse 
des Nutzers, Datum, Uhrzeit, URL und weitere Parameter gespeichert. Die au- 
tomatisierte Erfassung von Nutzerdaten muss vom Portalbetreiber vor der COIP- 
Freischaltung eingerichtet werden, um Datenverluste vermeiden und Nutzerak- 
tivitäten bezogen auf Wettbewerbsphasen erfassen zu können. In der Anfangs- 
phase des Wettbewerbs finden sich z. B. besonders viele Aneignungshandlun- 
gen (Bucher 2004), die der Erschließung des COIP-Angebotes bei Erstkontakt 
(initial contact situation, Wirtz/Jakobs 2013) dienen (z. B. sich registrieren, sich 
Überblick verschaffen). Wird eine Phase nicht über Logfiles erfasst, müssen 
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Phänomene, die diese auszeichnen, aufwändig (z. B. in Nutzertests) rekonstru- 
iert werden. 

Die Erhebung von Logfiles für nutzerbezogene Analysezwecke ist ein sen- 
sibler Punkt: Da das Logfile Daten enthält, die Rückschlüsse auf den Portalnut- 
zer zulassen (IP-Adresse, persönliche Daten aus der Registrierung, u. a.), kann 
der Portalbetreiber die Herausgabe von Logfiles aufgrund rechtlicher (und ethi- 
scher) Bedenken verweigern. Eine Form des Datenschutzes ist die Anonymisie- 
rung der Daten (z. B. durch Nummerierung der IP-Adressen), die jedoch Mehr- 
aufwände für beide Seiten erzeugt: Der Betreiber muss im Logfile Nutzerdaten 
anonymisieren, der Forscher muss bestehende Logfileanalysetools der neuen 
Formatierung anpassen. 

Wie Nutzer die Gebrauchsmusterrealisierung (z. B. Gestaltungseigenschaf- 
ten der Wettbewerbsfunktionen und des Toolkits) wahrnehmen und bewerten, 
kann nicht aus authentischen Daten abgeleitet werden (nur, wenn sich Nutzer 
zu diesem Thema in der Community äußern). Eine methodische Alternative 
bieten Nutzertests, in denen Zielgruppenvertreter COIP-typische Aufgaben be- 
arbeiten und verbal kommentieren. Gebrauchsmusterspezifische Herausforde- 
rungen beginnen spätestens bei der Rekrutierung von Testpersonen. Wenn die 
Zielgruppe — wie im Fallbeispiel — die der „älteren Tüftler“ ist, entfällt die häu- 
fig in der Forschung praktizierte Lösung, für Analysezwecke Studierende zu 
rekrutieren. Der Anspruch, Testaufgaben realitätsnah zu gestalten, ist ebenfalls 
schwer umsetzbar; die wenigsten erreichbaren älteren Testpersonen sind „Er- 
finder“. Bestimmte Anteile der Portalnutzung, wie das Agieren in Online- 
Communities (kommentieren, interagieren, auf andere eingehen), lassen sich 
nur bedingt simulieren. 


3.2.3 Datenaufbereitung 


Die extrahierten Inhalte werden in eine Datenbank überführt. Ihre Ablage erfor- 
dert ein konsistentes, verständliches und prägnantes Benennungsschema, um 
spätere Suchvorgänge und Analysen effizient durchführen zu können (z. B. das 
Ermitteln des durchschnittlichen Zeitraums zwischen Ideeneinreichung und 
erstmaligem Auftreten eines bestimmten Kommentartyps, z. B. „Verbesserungs- 
vorschlag“). Die Ablage erfordert ein schlüssiges relationales Datenbankkon- 
zept: Zu jeder Tabelle muss ein angemessenes Relationsschema entwickelt und 
die Tabelle zu anderen Tabellen in Beziehung gesetzt werden (Kemper/ Eickler 
2004). Eine von mehreren Herausforderungen ist, Anforderungen späterer Ana- 
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lysen vorausschauend zu berücksichtigen: Fehler bzw. Defizite des Datenbank- 
konzepts verursachen zeitintensive Nachbesserungs- bzw. Erweiterungsarbei- 
ten. 


Gebrauchsmusterbezogene Herausforderungen 

Sind die Unterseiten eines COIP vollständig erhoben, müssen die mit HTML 
ausgezeichneten Beschreibungen und Kommentierungen von Ideen und die 
darin enthaltenen Angaben (u. a. Autor, Datum, Referenzen zu Dateien) vom so 
genannten Boilerplate (HTML-Tags, PHP-Skripte, etc.) getrennt werden. Die 
Trennung ist aufgrund des konsistenten Seitenaufbaus automatisiert per Skript 
möglich: Bestimmte Bestandteile des HTML-Quelltexts (HTML-Tags) umschlie- 
ßen nutzergenerierte Beiträge, die anhand der Tags leicht identifiziert und ex- 
trahiert werden können. Die erfassten Inhalte werden mit Metadaten beschrie- 
ben. Sie beziehen sich auf die Art des Inhalts (z. B. Idee versus Kommentar) 
sowie die Beziehungen zwischen Inhalten (z. B. X gehört zu Idee Y; X ist Kom- 
mentar zu Kommentar Y). Die Auszeichnung mit diesen Metadaten ist nur ma- 
nuell möglich. 


Themenbezogene Herausforderungen 

Die Erfassung der Beziehung zwischen extrahierten Inhalten ist insofern wich- 
tig, als - wie oben dargestellt - die Beschreibung von Ideen häufig über mehre- 
re Typen von Dateien und Dokumenten eines Nutzers verstreut erfolgen kann 
(splitted topic description) bzw. in den Kommentaren anderer Portalnutzer 
weiterentwickelt wird. 


Domänenbezogene Herausforderungen 

Wenn die Metadatenbeschreibung Hinweise auf die Inhalte der eingereichten 
Ideen liefern soll (z. B. Verschlüsselungsverfahren für Mobiltelefone oder typi- 
sche Hardware-Komponenten), erfordert dies in der Regel domänenspezifisches 
Wissen, das Zusatzaktivitäten bedingt, wie den Austausch mit Experten. Die 
konsistente Vergabe derartiger domänenspezifischer Metadaten bedingt den 
Aufbau und die Pflege eines Lexikons. 
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Nutzertypbezogene Herausforderungen 
Analyseaufgaben wie die Identifikation von Vertretern der primären Zielgruppe 
(hier: Seniorexperte) oder Lead Usern erfordern die Verfügbarkeit nutzerspezifi- 
scher Daten wie Pseudonym, Name, Geschlecht, Alter, Nutzertyp (z. B. bestimmt 
nach der Anzahl eingereichter Ideen oder Kommentare pro Nutzer), die in der 
Datenbank als Metadaten erfasst werden. Die Ermittlung nutzerbezogener Da- 
ten stößt an ihre Grenzen, wenn Nutzer bei der Registrierung erfundene Selbst- 
auskünfte geben, wenn sie keine ergänzenden freiwilligen Angaben machen 
oder wenn nicht alle im COIP registrierten Daten öffentlich zugänglich sind. 
Eine andere Herausforderung betrifft die Aufbereitung von Logfiles: Die 
Logfiles müssen für die Auswertung zunächst bereinigt werden, d. h. automati- 
sierte Zugriffe von Suchmaschinen und nicht intendiertes Nutzungsverhalten 
(z. B. Hackerangriffe) identifiziert und entfernt werden. Die Unterscheidung von 
tatsächlichen COIP-Nutzern, Suchmaschinencrawlern und Personen, die das 
COIP zweckentfremdet nutzen, erfordert eine umfangreiche Analyse des Log- 
files. Der Umfang ergibt sich aus der gebrauchsmusterbedingt hohen Anzahl 
von Logfileeinträgen sowie der Notwendigkeit, jeden Fileeintrag manuell zu 
überprüfen. Die Identifikation nicht analyserelevanter Fileeinträge erfolgt an- 
hand von Bestandteilen, die sich auf den Zugreifenden (z.B. IP-Adresse) bezie- 
hen sowie den Zugriffsort im Portal (z. B. robots.txt, Adminbereich). Das Aufbe- 
reiten der Logfiles ist wichtig für die Qualität von Analyseergebnissen (z. B. für 
den Vergleich von Unterseiten nach der Häufigkeit ihres Aufrufs). 


3.2.4 Datenanalyse 


Gegenstand der Datenanalyse ist die Betrachtung von Nutzungsaktivitäten in 
der Zeit, des Zusammenhangs von Design und Portalnutzung, die Rekonstrukti- 
on der Entstehung von Inhalten (z. B. über die Analyse von Idee-Kommentar- 
Strängen), das Erfassen gebrauchsmusterspezifischen Handelns (z. B. die Tona- 
lität von Ideenbeschreibungen, Kommentaren und Nachrichten) sowie die Er- 
mittlung von Unterstützungsbedarf (etwa bezogen auf das Toolkit). Ein anderer 
analyserelevanter Komplex betrifft die Formen und Regeln des sprachlich- 
sozialen Agierens und Interagierens in der Plattform-Community (z. B. über die 
Analyse intertextueller Äußerungen und/oder von Äußerungen, die das soziale 
Verhalten der Plattformnutzer kommentieren). 
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Gebrauchsmusterbezogene Herausforderungen 

Die Analyse der sich in den Wettbewerbsphasen anteilig verändernden Nutzer- 
aktivitäten erfolgte anhand der Logfileeinträge, sie nutzte die dort enthaltenen 
zeitlichen Metadaten (time stamps). Im Fallbeispiel zeigte sich, dass in frühen 
Phasen die Aneignung des Systems das Einstellen von Ideen und der Aufbau 
der Community im Vordergrund stehen, in späten Phasen das Diskutieren, In- 
teragieren und Weiterentwickeln eingereichter Ideen in der Community. 

Logfileanalysen liefern u. a. Hinweise darauf, wie sich Gestaltungsmerkma- 
le auf das Nutzerverhalten auswirken. Im Einzelnen wurde geprüft, wo (auf 
welchen Unterseiten) die Nutzer bevorzugt in das Portal einsteigen bzw. aus- 
steigen, welche Funktionen und Inhalte häufig aufgerufen werden und welche 
nicht sowie wo besonders viele „Rückschritte“ auf dem Bewegungspfad auftre- 
ten (z. B. als Indikator für Nutzungsprobleme und „sensible“ Gestaltungsantei- 
le). Die Analysen ergaben u. a., dass 91,76% der Nutzer den Portalbesuch beim 
Registrierungsprozess abbrachen. Die Gründe dafür zeigten sich erst im Nutzer- 
test. Die Testpersonen äußerten ein massives Unbehagen, persönliche Daten 
preiszugeben und Angst vor Datenmissbrauch (Digmayer/Jakobs 2012a). 

Wie das Beispiel zeigt, erschließen sich Phänomene oft erst in der Kombina- 
tion quantitativer und qualitativer Methoden. Rein quantitative Angaben sind 
häufig interpretationsbedürftig. Im Fallbeispiel ergab die Logfileanalyse für den 
Toolkit-Handy-Konfigurator geringe Zugriffe und zahlreiche Rückschritte in den 
Nutzerpfaden. Die Gründe zeigten sich erst im Nutzertest. Das Tool überforderte 
insbesondere ältere Nutzer (durch zu viele Gestaltungsoptionen und unklare 
Handlungssequenzen); sie brachen deshalb häufig die Nutzung ab. Eine an- 
schließende Testreihe mit multimodalen eTutorials ergab, dass diese COIP- 
Nutzer in komplexen interaktiven Nutzungssituationen wirkungsvoll unterstüt- 
zen können (z.B. durch Handlungsabfolgen begleitende verbale Anweisungen 
und ihre Visualisierung; Digmayer/Jakobs 2012 b). 


Themenbezogene Herausforderungen 

Teil des Gebrauchsmusters ist die Erwartung, dass die Teilnehmer die auf der 
Plattform eingereichten Ideen bewertend kommentieren. Teil der Analyse 
sprachlicher Bewertungshandlungen (Ripfel 1987, Sandig 2003) ist die Identifi- 
zierung des Bewertungsgegenstands (Was wird bewertet?) bzw. -aspektes (Wel- 
che seiner Eigenschaften wird bewertet?), von Vergleichsgrößen (Womit wird er 
verglichen?) und Bewertungsmaßstäben. Die Rekonstruktion des Bewertungs- 
gegenstandes bzw. -aspektes wird erschwert, wenn ein Thema (hier: Idee) - wie 
oben dargestellt - auf mehrere Dateien verteilt beschrieben wird und/oder 
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wenn sich die Bewertung auf Sachverhalte bezieht, die auf externen Websites 
expliziert werden (Beispiel: „Die Idee ist nicht neu, siehe hier [Link]“). Andere 
Herausforderungen ergeben sich im Falle „unvollständiger Bewertungshand- 
lungen“, z. B., wenn das Bewertete nicht benannt wird (Beispiel „Das finde ich 
toll“). 

Die themenbezogene Analyse der Nutzerbeiträge indiziert, dass das sprach- 
liche Verhalten der Teilnehmer themen- und rollenbezogen variiert (vgl. Dig- 
mayer 2016). Die Beschreibung von Ideen erfolgt primär in einem sachlich- 
neutralen Stil, an Normen des Schriftsprachlichen orientiert. In den Kommenta- 
ren variiert der Ton; er kann - z. B. im Falle eigener Betroffenheit - emotional 
gefärbt sein und vom Standardsprachlichen abweichen, wie das Zitat im fol- 
sendem Beispiel illustriert: Der Verfasser wehrt sich gegen den Vorwurf, eine 
Idee von einem anderen Nutzer übernommen zu haben. Der Ton des Kommen- 
tars weicht merklich von den sachlichen Ideenbeschreibungen ab. 

Zitat: „Ich glaube nicht, dass ich es nötig habe irgendetwas "abzukupfern" 
;-)=) - es kann sein, dass auch andere ähnliche Ideen haben - na und. Die meis- 
ten Sachen geistern mir schon seit Jahren(!) im Kopf herum und jetzt werden sie 
niedergeschrieben. Ein anderer hat's zuerst veröffentlicht - na und ? Ist die Idee 
deshalb schlecht? Wenn's jetzt um den Nachweis geht, wer hat was wann zuerst 
... Naja, das interessiert MICH an dieser Stelle herzlich wenig.“ 


Nutzertypbezogene Herausforderungen 
Bezogen auf die Weiterentwicklung von Ideen (Co-Creation) richtete sich das 
Forschungsinteresse auf die Ermittlung von Nutzertypen. Im Fallbeispiel erfolg- 
te die Bildung nach den Kriterien Häufigkeit der eingereichten Ideen und Kom- 
mentare. Die Zuordnung zu Typen ist anhand der Angaben in der Datenbank 
maschinell möglich. Die Analyse ergab vier Typen: Nutzer, die primär Ideen 
einreichen (Erfinder), Nutzer, die primär kommentieren (Kommentatoren), Nut- 
zer, die Ideen einreichen wie auch kommentieren (kommentierende Erfinder) 
sowie Passive, die Aktivitäten im Portal lediglich beobachten. Alternativ sind 
andere Kriterien denkbar, z.B. die Einteilung nach dem Interaktionsverhalten 
(z.B. Reagieren auf andere Kommentare und/oder auf das Verhalten anderer 
Nutzer) oder linguistischem Profil (z. B. Grad der Schriftsprachlichkeit, Tonali- 
tät). Die Nutzertypermittlung nach diesen Kriterien ist nur manuell möglich. 
Domänenbezogene Herausforderungen: Die Identifikation von Nutzertypen 
mit hohem Innovationspotential (Lead Usern) ist insbesondere für Unterneh- 
men von Interesse, sie erfordert Parameter, die nur in der Zusammenarbeit mit 
Domänen-Experten definierbar sind: Neben Postinghäufigkeit, Interaktionsver- 


136 —— Jakobs/Digmayer/Trevisan 


halten und linguistischem Profil muss das Domänenwissen des Nutzers bewer- 
tet werden. Dies ist ohne Experten des jeweiligen Wissensgebiets kaum mög- 
lich. 


4 Fazit 


Vergleicht man die oben beschriebenen IBK-Beispiele und die damit verbunde- 
nen methodischen Herausforderungen, so zeigen sich Gemeinsamkeiten wie 
Unterschiede, wobei die Unterschiede deutlich überwiegen. Gemeinsamkeiten 
ergeben sich u.a. bezogen auf den Bedarf nach leistungsfähigen Systemen für 
das Datenmanagement, z.B. flexible und zugleich belastungsfähige Benen- 
nungs- und Metadatensysteme. Unterschiede des methodischen Herangehens 
zeigen sich in allen Phasen - von der Datenerhebung bis zur Datenanalyse. Sie 
ergeben sich zum einen durch Charakteristika der Gebrauchsmuster, zum ande- 
ren durch nutzer-, domänen- und themenbezogene Herausforderungen. 

Datenerhebung: Methodisch relevante Unterschiede ergeben sich bereits 
aus dem Gegenstand: im Falle thematischer Blogkommentare interessieren 
nicht nur die Kommentare eines Blogs, sondern alle Beiträge zu einem Thema. 
Die Erhebung erfolgt dementsprechend verteilt über mehrere Blogs (als Quellen; 
vgl. Abb. 5). Im Falle von COIP hat man eine Quelle, in der die Themenbehand- 
lung in verschiedenen, aufeinander bezogenen Bereichen erfolgt (Ideeneinrei- 
chung vs. Ideenkommentierung/-weiterentwicklung in der Community). Im 
Falle des thematischen Kommentars erfolgt die Themenbehandlung in einem 
Text, der sich auf andere beziehen kann, jedoch nicht muss. Dies gilt ähnlich 
für die COIP-Kommentare; in anderen Teilen des COIP (Ideeneinreichung) er- 
folgt die Themendarstellung dagegen häufig verteilt auf verschiedene Dateien 
und Modalitäten. Im Falle thematischer Blogs dominiert eine kommunikative 
Ressource - geschriebene Sprache. 

Bei beiden Gebrauchsmustern sind unterschiedliche Dateitypen zu berück- 
sichtigen. Blogkommentare können in drei verschiedenen Formaten (.html, 
jpeg, .avi) vorliegen und zwei Modalitäten (textuell vs. audio-visuell). Die Hete- 
rogenität der zu erhebenden Datenformate (vgl. Abb. 5 unten) ist im Falle von 
COIP wesentlich höher; sie umfasst 16 Datenformate und drei Modalitäten (tex- 
tuell, visuell, audio-visuell). 
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Abb. 5: Gegenüberstellung: Blogkommentar vs. COIP 


Die Herausforderungen der Datenerhebung variieren gebrauchsmusterbezogen. 
Bei beiden betrachteten Gebrauchsmustern repräsentieren Musterrealisierun- 
gen zeitlich-begrenzte kommunikative Ereignisse. Ein daraus für die Datener- 
hebung resultierendes Risiko ist die (unangekündigte) Beendigung des Ereig- 
nisses (Offline-Schaltung durch den Betreiber). Das Eintreten einer Offline- 
Schaltung hat gebrauchsmusterspezifische Konsequenzen: Im Falle einzelner 
abgeschalteter Blogs (dass alle Blogbeiträge zu einem Thema zeitgleich abge- 
schaltet werden, dürfte eher selten der Fall sein) kommt es zum partiellen Ver- 
lust von Daten. Wird ein COIP geschlossen, gehen alle Portaldaten verloren. 

Auch die Aufwände der Datenerhebung variieren gebrauchsmusterspezi- 
fisch. Im Falle thematischer Blogkommentare erhöhen unterschiedlich struktu- 
rierte Quellen den Aufwand der semi- wie auch der voll-automatischen Daten- 
erhebung durch die notwendige Anpassung der Erhebungsmethodik. Bei COIP, 
bei denen die Unterseitenerzeugung mit Java-Script erfolgt, ist die Datenerhe- 
bung (mit Ausnahme von Logfileaufzeichnungen) nur manuell möglich und 
dadurch sehr aufwändig. 

Datenaufbereitung: Auch hier unterscheiden sich die Aufwände gebrauchs- 
musterbezogen. Im Falle thematischer Blogkommentare müssen Ankertexte ent- 
fernt werden. Im Falle von COIP ist der Aufwand höher: es müssen irrelevante 
Einträge identifiziert und bereinigt sowie Inhalte von der Boilerplate getrennt 
werden. Je nach Gebrauchsmuster ergeben sich andere zeitliche und inhaltliche 
Aufwände. Der Aufwand ist bei Blogkommentaren geringer im Vergleich zu 
COPI, da Metadaten, die durch den Blogbetreiber bereitgestellt werden, genutzt 
werden können. Bei COIPs werden keine Daten durch den Betreiber bereitge- 
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stellt; sie müssen vom Daten Aufbereitenden selbst entwickelt und den Daten- 
sätzen zugeordnet werden. Die Datenaufbereitung thematischer Blogkommen- 
tare erzeugt Mehraufwände durch Aufbereitungsschritte wie Annotation (PoS 
Tagging, semi-automatische Mehrebenen-Annotation), Datenanreicherung 
(Lexikon) und Datenverfeinerung (Bildung von Subkorpora). Im Falle von COIPs 
entfällt die Annotation. 

Datenanalyse: Die stärksten Unterschiede zeigen sich — gebrauchsmuster- 
bedingt — in der Analysephase. Sie wurden umfangreich in Kapitel 3.1.4 und 
3.2.4 beschrieben. 


5 Ausblick 


Insgesamt zeigt sich, dass gerade im methodischen Bereich in naher Zukunft 
viel an Forschungsarbeit zu leisten ist. Dies zeigten u.a. die Diskussionen des 
Empirikom-Netzwerkes. Der gegenstandsbedingt starke Bedarf nach computer- 
gestützten Erhebungs-, Aufbereitungs- und Analysemethoden bzw. -tools erfor- 
dert eine intensive Zusammenarbeit von (angewandter) Linguistik und Infor- 
matik bzw. informatiknahen Disziplinen, etwa Texttechnologie und 
Computerlinguistik. Wie aktuelle Studien zur Verbindung traditioneller For- 
schungsmethoden (etwa der linguistischen Diskursanalyse) mit neuen compu- 
tergestützten Verfahren (etwa des Textmining bzw. NLP) zeigen (u.a. Niehr 
et al. 2015), gibt die verschränkte Methodenentwicklung wichtige Impulse für 
beide Seiten. Generell ist davon auszugehen, dass von der Zügigkeit methodi- 
scher Innovationen abhängen wird, wie schnell wir eine genauere Vorstellung 
davon haben, wie sich die Landschaft der internetbasierten Kommunikation 
gestaltet, was sie auszeichnet und wie sie sich verändert. 
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1 Einleitung! 


Der Forschungsbereich Computervermittelte Kommunikation (CvK bzw. CMC für 
Computer-mediated Communication) erforscht aus der Perspektive der Sozial- 
wissenschaft und Linguistik soziale, interaktionale und sprachliche Besonder- 
heiten bei der Kommunikation über internetbasierte Kommunikationstechnolo- 
gien. Aus der Perspektive der Informatik beschäftigt sich dieser 
Forschungsbereich mit der Gestaltung, Entwicklung und Evaluation von Kom- 
munikationssystemen. Ein wichtiges Teilgebiet ist dabei die synchrone Kom- 
munikation, bei der die Teilnehmer zur selben Zeit an verschiedenen Orten 
miteinander in Beziehung treten. Obwohl derzeit die Nutzung von Audio- und 
Videokonferenzsystemen immer stärker zunimmt, ist die rein schriftbasierte 
Kommunikation historisch als erstes in Erscheinung getreten (Latzko-Toth 2010) 
und nimmt seitdem einen großen Raum in der privaten und beruflichen Kom- 
munikation ein (Beißwenger/Storrer 2005). 

Dieser Beitrag beschäftigt sich an der Schnittstelle zwischen diesen Diszip- 
linen mit dem Interaktionsmanagement in synchroner Schriftkommunikation, 
das sich grundlegend von der Turn-Organisation mündlicher Gespräche unter- 
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scheidet (Beißwenger 2007, 2016). Eine Möglichkeit, das Interaktionsmanage- 
ment zu unterstützen, sind Regelsysteme und Konventionen, an die sich die 
Teilnehmer halten sollen, um eine geregelte Gesprächsfolge zu gewährleisten 
(Beißwenger 2005). Eine andere Möglichkeit ist die Modifikation der techni- 
schen Systeme, um den Teilnehmern fehlende Informationen bereitzustellen 
und erweiterte Möglichkeiten der Interaktion zu bieten. 

An dem Punkt der Modifikation technischer Systeme setzen die Forschun- 
sen des Ebiss-Projekts an. Zentrale Idee ist die Einbindung eines zusätzlichen 
Kanals zur Übertragung menschlicher Handlungen durch Eyetracking. Unter 
Eyetracking ist die die Aufzeichnung, Auswertung und Rückspiegelung von 
Blickbewegung der Kommunikationspartner zu verstehen. Die Auswertung von 
Eyetracking-Informationen ermöglicht Aussagen über das Interaktions- und 
Leseverhalten der Nutzer. Auf Basis von Methoden zur Erkennung von Lesever- 
halten (z.B. Biedert et al. 2012a) sollen Algorithmen entworfen werden, die 
Rückschlüsse auf das Lesen des Bildschirmprotokolls bzw. einzelner Postings 
im Rahmen synchroner Schriftkommunikation erlauben. Diese Rückschlüsse 
sollen mit Informationen zum Aktivitätskontext der Chat-Beteiligten verknüpft 
werden. 

Im Folgenden wird ausführlicher auf die Problemstellung des Interakti- 
onsmanagements in synchroner Schriftkommunikation (Abschnitt 2) und den 
Lösungsansatz des Eyetrackings als zusätzliche Informationsquelle (Abschnitt 
3) eingegangen. Anschließend wird die Grundlage für die Identifikation typi- 
scher Problemstellen in den kommunikationsbezogenen Aktivitäten der Betei- 
ligten (Abschnitt 4) gelegt, bevor Ergebnisse einer Machbarkeitsstudie (Ab- 
schnitt 5) und erste Schritte des aus den Vorarbeiten entstandenen DFG- 
Projektes Ebiss (Abschnitt 6) präsentiert werden. Ziel des Projektes Ebiss ist es, 
Eyetracking als innovative Mensch-Maschine-Schnittstelle für die Unterstüt- 
zung synchroner schriftbasierter Kommunikation einsetzen zu können. Der 
Beitrag endet mit einer Zusammenfassung und einem Ausblick (Abschnitt 7). 


2 Problemstellung: Interaktionsmanagement in 
synchroner Schriftkommunikation 
Unter der Perspektive des Interaktionsmanagements sind bei der Kommunikati- 


on im Internet und in sozialen Medien zwei Ausprägungsformen synchroner 
Schriftkommunikation zu berücksichtigen: 
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1. Die Chat-Kommunikation, die ab Ende der 80er-Jahre zunächst in Form des 
Internet Relay Chat, Mitte der 90er-Jahre dann in Form WWW-basierter 
„Webchats“ populär wurde und die heutzutage in diversen Kommunikati- 
onsplattformen und sozialen Netzwerken als Funktion enthalten ist (vgl. 
z.B. Beißwenger 2007); mobile, prinzipiell synchrone Kommunikationsan- 
wendungen wie WhatsApp und Threema für Smartphones können als für 
die mobile Nutzung adaptierte Weiterentwicklungen der Chat-Technologie 
angesehen werden (vgl. z.B. Dürscheid/Frick 2014). 

2. Die Talk-Kommunikation, die v.a. in den 80er- und frühen 90er-Jahren in 
Form des Systems UNIX Talk populär war und in der Kommunikationsbei- 
träge zeichenweise übermittelt werden. 


Die Bedingungen des Interaktionsmanagements in der Chat-Kommunikation 
und die charakteristischen Unterschiede zur Turn-Organisation mündlicher 
Gespräche wurden in der linguistischen Forschung bereits vielfach und detail- 
liert adressiert (vgl. z.B. Garcia/Jacobs 1999, Herring 1999, Storrer 2001, Beiß- 
wenger 2003, 2007, Schönfeldt/Golato 2003, Zitzen/Stein 2005). Einschlägig zur 
Talk-Kommunikation ist die Studie von Meise-Kuhn (1998). Die nachfolgenden 
Abschnitte fassen einige zentrale Aspekte zusammen und skizzieren die Prob- 
leme, die sich in beiden Formen gegenüber dem mündlichen Gespräch für das 
Interaktionsmanagement, d.h. für die Herausforderung der Herstellung einer 
sequenziell kohärenten Abfolge von Beiträgen und kommunikationsbezogenen 
Aktivitäten der Beteiligten, ergeben. 


2.1 Chat 


Die Chat-Kommunikation unterscheidet sich vom mündlichen Gespräch in mehr 

als nur der Tatsache, dass Kommunikationsbeiträge getippt anstatt gesprochen 

werden und dass non- und paraverbale Mittel (Gestik, Mimik, Blickkontakt, 

Intonation) nicht zur Verfügung stehen. Vielmehr weist der Kommunikations- 

prozess gegenüber mündlichen dialogischen Settings weitere strukturelle Un- 

terschiede auf: 

— Die für die gesprochene Sprache charakteristische Einheit aus Verbalisie- 
rung und simultaner, äußerungsbegleitender Verarbeitung wird in eine 
konsekutive Abfolge von Aktivitäten zerlegt: Nachdem ein Chatter ent- 
schieden hat, einen Beitrag zum Interaktionsgeschehen leisten zu wollen, 
muss er diesen Beitrag zunächst als Ganzen formulieren und schriftlich 
enkodieren. Der Formulierungs- und Enkodierungsprozess bleibt für die 
anderen Akteure unsichtbar, eine Verarbeitung zur Laufzeit der Hervor- 
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bringung ist dadurch ausgeschlossen. Manche Chat- und Messaging- 
Systeme zeigen auf dem Nutzerinterface an, wenn ein Chatter mit der Pro- 
duktion eines Beitrags befasst ist (z.B. „Michael schreibt...“ in WhatsApp), 
der Prozess selbst bleibt aber unsichtbar. Erst wenn der Produzent seine 
eingegebene schriftliche Äußerung durch explizite Ausführung einer 
Übermittlungsanweisung an den Chat-Server verschickt (i.d.R. durch Betä- 
tigen der Eingabetaste oder durch Aktivierung einer „Senden“-Schaltfläche 
mit der Maus), wird diese an die Adressaten übermittelt und kann anschlie- 
ßend von ihnen wahrgenommen und rezipiert werden. Der Prozess der Äu- 
ßerungsproduktion in Chats unterscheidet sich somit fundamental vom 
Prozess der Äußerungsproduktion in mündlichen Gesprächen: Der Prozess 
der Produktion geht der Rezeption voraus; rezipiert wird nicht die inkre- 
mentelle Entstehung der Äußerung, sondern ein schriftlich am Bildschirm 
repräsentiertes Äußerungsprodukt. Für die Zeitlichkeitsbedingungen der 
Interaktion hat dies erhebliche Konsequenzen. Um die Beitragsproduktion 
in Chats mit Blick auf diese Unterschiede auch begrifflich von der Turnkon- 
struktion in gesprochener Sprache abzugrenzen, spricht Beißwenger (2016) 
von einer „Realisierung von Kommunikationsbeiträgen im Posting-Format“. 
— Während im Gespräch die Devise „Einer zur Zeit“ gilt, nach welcher im 
Standardfall immer nur ein Beteiligter spricht, während die übrigen Betei- 
ligten die Hörerrolle einnehmen, kann im Chat jeder Beteiligte jederzeit mit 
der Produktion eines neuen Beitrags beginnen. Zwar ist dies grundsätzlich 
auch im Gespräch möglich; da allerdings längeres Parallelsprechen zweier 
oder mehrerer Parteien im Gespräch das Risiko birgt, dass keiner der Spre- 
chenden sein Handlungsziel realisieren kann, wird dies von den Ge- 
sprächsbeteiligten in der Regel vermieden. Stattdessen werden die Zuwei- 
sung und der Wechsel der Sprecherrolle an geeigneten Punkten zwischen 
den Beteiligten ausgehandelt. Im Chat ist ein wechselseitiges Überschrei- 
ben von Beiträgen ausgeschlossen: Gleichzeitig verschickte Postings wer- 
den vom Server unabhängig voneinander bearbeitet und im Verlaufsproto- 
koll am Bildschirm als separate Beiträge angezeigt. Ein Wechsel der 
Produzentenrolle — analog zum Sprecherwechsel in mündlichen Gesprä- 
chen - muss daher nicht notwendigerweise zwischen den Chattern ausge- 
handelt werden. Die gleichzeitige, unabgestimmte Produktion von Beiträ- 
gen kann daher im Chat als Standardfall gelten; im mündlichen Gespräch 
bildet sie die Ausnahme. Als Konsequenz ist für die Akteure weder antizi- 
pierbar, welche Rollen die anderen Akteure gerade einnehmen, noch, wann 
mit dem Eintreffen neuer Beiträge von ihnen am Bildschirm zu rechnen ist. 
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Wahrnehmbar werden die Kommunikationsbeiträge der Chat-Beteiligten 
vermittelt über das Verlaufsprotokoll am Bildschirm, in das jedes Posting 
nach der Verschickung vom Server eingeordnet wird. Die Erzeugung des 
Bildschirmprotokolls und die Anordnung der Postings unterliegen dem 
Chat-Server. Die einzelnen Chatter können zwar anvisieren, ihr Posting an 
einer bestimmten Position im Verlaufsprotokoll zu platzieren, die tatsächli- 
che Einordnung wird aber erst nach der Verschickung durch den Chat- 
Server festgelegt - im Falle von Standard-Chat-Systemen nach dem Ord- 
nungskriterium „Wer zuerst kommt, mahlt zuerst“ (sog. „Mühlen-Prinzip“, 
Wichter 1991). 

Zudem ergeben sich für die Chat-Kommunikation durch die Tatsache der 
medial graphischen Realisierung? Merkmale, die an grundsätzliche materiel- 
le Eigenschaften von Schrift geknüpft sind: Schrift ist ein Augenmedium; 
um wahrgenommen zu werden, müssen die Adressaten ihre visuelle Auf- 
merksamkeit auf den Träger der schriftlichen Äußerung (im Falle von Chat: 
den Bildschirm) richten. 


Für das in mündlichen Gesprächen genutzte System der Sprecherwechselorga- 
nisation zur Laufzeit der Interaktion (Turn-taking) haben die beschriebenen 
Kommunikationsbedingungen beim Chatten erhebliche Konsequenzen: 


Gegenüber mündlichen Gesprächen ist für den Kommunikationsprozess in 
synchroner Schriftkommunikation von einer zweifachen zeitlichen Ent- 
kopplung von Produktion und adressatenseitiger Verarbeitung auszugehen 
(vgl. Beißwenger 2007, 2015): (1) Entkopplung von Produktion und Übermitt- 
lung: Beiträge werden aufgrund der Realisierung im Posting-Format grund- 
sätzlich erst im zeitlichen Nachhinein zu ihrer Hervorbringung für die Ad- 
ressaten wahrnehmbar; die Prozessualität der Beitragsproduktion bleibt 
den Adressaten verborgen; (2) Entkopplung des Anzeigezeitpunkts von Pos- 
tings am Bildschirm vom Zeitpunkt ihrer Wahrnehmung und Verarbeitung: 
Aus der Tatsache, dass ein Posting am Bildschirm angezeigt wird, kann 
nicht geschlossen werden, dass es auch unmittelbar von den anderen Akt- 
euren verarbeitet wird; vielmehr lässt sich durch Beobachtung der kommu- 
nikationsbezogenen Aktivitäten der Chatter zeigen, dass Postings häufig 
erst im zeitlichen Nachhinein wahrgenommen und respondiert werden (vgl. 
Beißwenger 2007). Es ist daher in Chats nicht ungewöhnlich, dass zum glei- 


2 ‚Medium’ hier i.S.v. Koch/Oesterreicher 1994 als Konzept für die materielle Realisierung 
einer sprachlichen Äußerung, die sich entweder in graphischen oder in lautlichen Hervorbrin- 
gungen manifestiert. 
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chen Realzeitpunkt verschiedene Chatter unterschiedliche Auffassungen 
über den aktuellen Stand ihrer Interaktion haben - abhängig davon, wann 
sie das letzte Mal auf den Bildschirm geblickt haben und welche der dort 
angezeigten Beiträge sie bereits zur Kenntnis genommen haben. Zum Ele- 
ment des individuellen Laufwissens über den Interaktionsverlauf wird ein 
Posting erst in der Rezeption; solange es nicht zur Kenntnis genommen 
wurde, mag es zwar am Bildschirm existent sein, für die anvisierten Adres- 
saten hat es aber noch keine interaktionale Realität. 

— Im Unterschied zu mündlichen Gesprächen ist in der Chat-Kommunikation 
für die einzelnen Beteiligten nicht antizipierbar, welche Beteiligungsrolle in 
Bezug auf die Weiterentwicklung des Kommunikationsverlaufs die anderen 
Beteiligten aktuell für sich gewählt haben und wie engmaschig sie zwischen 
produktiven und rezeptiven Beteiligungsaktivitäten wechseln: Rezipieren 
sie gerade Beiträge am Bildschirm? Warten sie auf einen antizipierten 
nächsten Zug eines anderen Akteurs? Sind sie mit der Produktion eines 
neuen eigenen Beitrags befasst? Wenn Letzteres: Nehmen sie während ihrer 
Produktionstätigkeit Beiträge, die neu am Bildschirm eintreffen, unmittel- 
bar wahr oder nicht? Die Beteiligung an chatbasierter Interaktion erweist 
sich unter diesem Aspekt als ein hochgradig individuelles Projekt: An die 
Stelle einer kommunikationsbegleitenden Aushandlung von Beteiligungs- 
rollen zwischen den Beteiligten tritt die immer wieder neue individuelle 
Adaption der eigenen kommunikationsbezogenen Aktivitäten an den aktu- 
ellen Stand des Bildschirmprotokolls (vgl. Beißwenger 2007: Kapitel 4.6 u. 
7). In dieser Hinsicht ist Chat im wahrsten Sinne des Wortes vermittelte 
Kommunikation: Den zentralen Bezugspunkt bildet das Bildschirmproto- 
koll, aus dessen Inhalt und Struktur die Beteiligten individuelle Repräsenta- 
tionen der ablaufenden Interaktion aufbauen. Die individuellen Auffassun- 
gen über den aktuellen Stand der Interaktion können zum gleichen 
Zeitpunkt unterschiedlich sein, abhängig davon, wann die einzelnen Betei- 
ligten das letzte Mal auf den Bildschirm geblickt und welche Beteiligungs- 
rolle sie aktuell für sich gewählt haben. Eine vollständige Synchronisierung 
der individuellen Sichten auf den Interaktionsverlauf ist aufgrund der be- 
sonderen Zeitlichkeitsbedingungen unmöglich. 


2.2 Talk 


Die Talk-Technologie ermöglicht gegenüber der Chat-Technologie ein Monito- 
ring individueller Verbalisierungsprozesse zur Laufzeit: Die Übermittlung von 
Tastatureingaben erfolgt zeichenweise und nicht erst en bloc nach Fertigstel- 
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lung eines Beitrags im Posting-Format. Im Gegensatz zur Chat-Kommunikation 
wird dadurch eine inkrementelle Rezeption der sprachlichen Äußerung beglei- 
tend zu ihrer Hervorbringung möglich. Dies erlaubt eine Realisierung von 
Rückmeldungen aus der Rezipientenposition zur Laufzeit der Hervorbringung 
(ähnlich turnbegleitenden „backchannel cues“ im Gespräch) sowie die Aus- 
handlung von Sinn und Verstehen begleitend, nicht nachträglich, zur Äuße- 
rung. 

Dennoch ist auch das Interaktionsmanagement in der Talk-Kommunikation 
den materiellen Eigenschaften von Schrift unterworfen und findet unter ande- 
ren Bedingungen statt als das Interaktionsmanagement in mündlichen Gesprä- 
chen: Zwar wird der Produktionsprozess transparent und als Ressource für das 
Interaktionsmanagement nutzbar; die Wahrnehmung und Verarbeitung von 
Äußerungen ist aber nach wie vor auf die Mitwirkung der Adressaten angewie- 
sen, die ihre visuelle Aufmerksamkeit auf den Bildschirm richten müssen, um 
die Äußerung zur Laufzeit ihrer Hervorbringung zu rezipieren. Ob die Adressa- 
ten dies tun oder nicht, ist für die Produzenten nicht antizipierbar. Zwar ist die 
Talk-Kommunikation von den Kommunikationsbedingungen her näher am 
mündlichen Gespräch als die Chat-Kommunikation; aufgrund der medialen 
Schriftlichkeit ergeben sich aber auch hier erschwerte Bedingungen für eine 
Aushandlung und Koordination von Beteiligungsrollen zur Laufzeit der Interak- 
tion. 


3 Lösungsansatz: Eyetracking als zusätzliche 
Informationsquelle 


Eine Möglichkeit das Interaktionsmanagement in Chat oder Talk, ähnlich wie 
im mündlichen Gespräch, zu etablieren, sind Regelsysteme und Konventionen, 
an die sich die Teilnehmer halten sollen, um eine geregelte Beitragsfolge zu 
gewährleisten (Beißwenger 2005). Eine andere Möglichkeit ist die Modifikation 
der technischen Systeme, um den Teilnehmern fehlende Informationen bereit- 
zustellen und erweiterte Möglichkeiten der Interaktion zu bieten. Dazu zählen 
Ansätze, welche die Gesprächsprotokolle so darstellen, dass sich die Zuordnung 
von Beiträgen zu Gesprächsfäden leichter treffen lässt (Übersicht bei Holmer & 
Wessner 2005) oder die technische Unterstützung von Rederechtverteilung zur 
Ablaufkontrolle durch einen Moderator übernommen wird (Kienle, 2009). In 
einer detaillierten empirischen Studie von unmoderierten Chats hat Beißwenger 
(2007) aufgezeigt, dass es, bedingt durch die medialen Eigenschaften des einge- 
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setzten Systems, einen hohen Anteil von Beiträgen gab, die verfasst wurden 
ohne abzuwarten was die Gegenseite schreibt, und die deswegen inkohärent 
zum Stand der Diskussion waren. Beißwenger konnte durch eine zusätzliche 
Einbeziehung von Screencam-Daten zur Beitragsproduktion sowie von video- 
grafierten Blickrichtungsdaten für die einzelnen Chatter herausarbeiten, dass 
die Chatter, wenn sie während der Beitragsproduktion neue Partnerbeiträge am 
Bildschirm wahrnahmen, z.T. umfassende Revisionen oder gar Löschungen an 
ihren Textentwürfen durchführten, um ihren aktuell verfolgten Beitragsplan 
zum veränderten Stand des Bildschirmprotokolls passend zu machen. Das Prob- 
lem des kohärenten Anschlusses von Folgebeiträgen an den aktuellen Stand der 
Interaktion wird damit vom Chatter individuell bearbeitet; unter Bedingungen 
wechselseitiger Wahrnehmung (wie im Gespräch) kann das Problem hingegen 
von den Beteiligten interaktiv zur Laufzeit bearbeitet werden (Turn-Organisa- 
tion in Gesprächen), so dass Fälle unabgestimmter Parallelproduktion im Ideal- 
fall gar nicht auftreten. 

Ein zentrales und bisher nicht gelöstes Problem ist die Erfassung und Steue- 
rung des Aufmerksamkeitsfokus für das Interaktionsmanagement in der syn- 
chronen Schriftkommunikation: Wer schreibt gerade an wen, wer liest gerade 
mit und von wem wurde gelesen, was geschrieben wurde. Alle Beteiligten ge- 
hen davon aus, dass Beiträge sofort gelesen und unmittelbar beantwortet wer- 
den, so wie man es in einem Gespräch erwartet. Unter dieser Annahme führen 
zeitliche Verzögerungen zu Irritationen, weil vermeintliches Zögern falsch in- 
terpretiert wird oder jeder Beitrag als gelesen vorausgesetzt wird und darauf 
aufbauende Missverständnisse erst im Nachhinein erkennbar sind. Solche Prob- 
leme könnten verhindert werden, wenn das Kommunikationssystem Informati- 
onen über den Aufmerksamkeitsfokus der Teilnehmer hätte und angemessen 
interpretieren und darauf reagieren würde. 

Einen zusätzlichen Kanal zur Übertragung menschlicher Handlungen stellt 
das Eyetracking, also die Aufzeichnung, Auswertung und Rückspiegelung von 
Blickbewegung der Kommunikationspartner, dar. Eyetracking ermöglicht Aus- 
sagen über das Interaktions- und Leseverhalten der Teilnehmer. Diese Aussagen 
basieren auf der Analyse der Fixationen (Fokussieren eines Bereichs) und Sak- 
kaden (Sprünge des Auges zwischen verschiedenen Bereichen) (Duchowski 
2007). 

Die bisher aus Kostengründen geringe Verbreitung von Eyetracking- 
Technologie verändert sich: Erstens drängen die Anbieter von Profi-Systemen in 
den Consumer-Bereich und planen die Integration ihrer Technologie in Stan- 
dardgeräte wie z.B. Laptops (Tobii 2013). Zweitens sind in zahlreichen For- 
schungsprojekten zum Eyetracking frei verfügbare Softwarewerkzeuge entwi- 
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ckelt worden (z.B. ITU GazeTracker von San Agustin et al. 2010) und Selbstbau- 
anleitungen für Eyetracking-Lösungen entstanden (Pavlas et al. 2012). Und 
drittens gibt es mittlerweile Bilderkennungs- und Verarbeitungsverfahren, die 
es erlauben, Videodaten der eingebauten Frontkameras in Laptops, Tablets und 
Smartphones zu benutzen und damit zufriedenstellende Ergebnisse zu erzielen 
(Biedert et al. 2012b). Diese Trends lassen erwarten, dass der Gebrauch von 
Eyetracking-Funktionalitäten in naher Zukunft alltäglicher als heute sein undin 
breiten Anwendungskontexten genutzt wird. 

Neben Hardware-basierten Fortschritten sind auch viele Funktionserweite- 
rungen der Software zu beobachten. Basierend auf klassischen Auswertungsme- 
thoden wie Fixationspunkten, Explorationsgrad und Blickbewegungspfad- 
Analysen wurden komplexere Verfahren entwickelt: Just & Carpenter (1980) 
entwickelten einen Ansatz, bei dem mittels Eyetracking die Dauer der Betrach- 
tung eines Wortes, Satzes oder Absatzes als Maß für die Verarbeitungskomplexi- 
tät der Information und damit des Textverständnisses ermittelt wurde. Biedert 
et al. (2012a) stellen einen Algorithmus vor, der zwischen Lesen und Skimming 
(Überfliegen) unterscheiden kann. Dies gelingt auch bei ungenauen Daten, wie 
sie in nicht-kontrollierten Situationen (Einsatz mobiler Geräte, Kopfbewegun- 
gen) und bei kleinen Schriftgrößen entstehen. 

Marshall (2007) schließt anhand verschiedener Maße wie der Verände- 
rungsgeschwindigkeit der Pupillengröße, der Blinzelrate und des Ausmaßes an 
Augenbewegungen auf verschiedene Grade von kognitiver Aktivität. Dabei kann 
durch die Kombination der Maße zuverlässig zwischen den Zuständen „ent- 
spannt“ oder „engagiert“, „fokussiert“ oder „abgelenkt“ und „wach“ oder „mü- 
de“ unterschieden werden. Koesling et al. (2011) stellten durch die Analyse von 
Blickbewegungsdaten in einem experimentellen First-Person-Shooter-Spiel fest, 
dass sich zukünftige Aktionen der Spieler ca. eine Sekunde vor Ausführung der 
Aktion in Echtzeit vorhersagen lassen. Durch die Analyse der Frequenz großer 
Blicksprünge konnte vorhergesagt werden, ob ein Spieler eher eine Aktion im 
rechten oder linken Teil des Bildschirms ausführen würde. 

Für die Unterstützung von Kommunikation und Kooperation mittels Eyetra- 
cking sind Blickkontakt und Gaze Sharing (das Wissen um den aktuellen Fokus 
des Gegenübers) essentielle Konzepte. In Videokonferenzen entsteht aufgrund 
des räumlichen Arrangements von Kamera und Monitor das Problem des feh- 
lenden Blickkontaktes. Dumont et al. (2008) lösen dies, indem sie aus Eyetra- 
cking-Daten und Daten mehrerer Kameras, die am Bildschirmrand positioniert 
sind, ein synthetisches Videobild erzeugen, welches dem Gegenüber so er- 
scheint, als ob er direkt fixiert werde. Gaze Sharing im Kontext von Zusammen- 
arbeit wird dadurch ermöglicht, dass der aktuelle Fokus der Kooperations- 
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partner mittels Eyetracker erfasst und als visuelle Markierung in den gemein- 
samen Arbeitsbereich eingeblendet wird. Die Zusammenarbeit wird effizienter, 
weil die Koordination (wer arbeitet wo) und die Deixis (welches Objekt ist ge- 
meint) auf non-verbale Art unmittelbar unterstützt wird (Brennan et al. 2012). 


4 Ausgangspunkt: Identifikation typischer 
Problemkonstellationen in den kommuni- 
kationsbezogenen Aktivitäten der Chat- 
Beteiligten 


Bei der Unterstützung synchroner Schriftkommunikation beschränkt sich der 
Einsatz von Eyetracking-Daten bisher auf die Übertragung des aktuellen Blick- 
punktes (Gaze Sharing). Dies reicht aber nicht aus, denn hier kommt es nicht 
allein auf den aktuellen Blickpunkt, sondern vor allem auf den Aktivitätskon- 
text an, in dem eine Fokussierung stattfindet. Unter dem Aktivitätskontext ver- 
stehen wir das Ensemble sämtlicher Aktivitäten, die für eine Rekonstruktion (a) 
der Auffassung eines Chatters über den aktuellen Stand der Interaktion und (b) 
der gegenwärtig von ihm ausgeführten Beteiligungsrolle in Bezug auf das Inter- 
aktionsgeschehen (Beitrag verfassen, Beiträge lesen) benötigt werden. In die- 
sem Kontext wird es möglich, bestimmte Events im Blickverhalten des Chatters 
als Indizien für das Auftreten typischer Probleme bei der individuellen Planung 
und Realisierung kohärenter Interaktionsbeiträge zu bewerten. Zentral für die 
Prognose solcher Problemstellen in der Interaktion ist der Abgleich des Aktivi- 
tätskontexts eines Chatters mit dem aktuellen Stand des Bildschirmprotokolls. 
Unser Ziel ist es, die Chatter auf Basis von Problem-Prognosen, die zur Laufzeit 
der Interaktion identifiziert werden, durch die Bereitstellung technischer Funk- 
tionen auf dem User-Interface bei der Vermeidung bzw. Bearbeitung der prog- 
nostizierten Probleme zu unterstützen. Als Konzept für eine solche Unterstüt- 
zung bietet sich das Konzept des attentive user interface an (Buscher et al. 2012), 
das Benutzer aktiv beobachtet und dessen implizite Aktionen interpretiert, an- 
statt auf explizite Kommandos zu warten, wie dies bei traditionellen ereignis- 
orientierten Benutzerschnittstellen der Fall ist. 

Den Ausgangspunkt für die Analyse des Aktivitätskontextes und für die Re- 
konstruktion typischer Problemstellen in synchroner Schriftkommunikation 
bildet die Studie von Beißwenger (2007), in der Probleme der Handlungskoor- 
dination in der Chat-Kommunikation auf der Basis einer Auswertung von Daten 
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aus Screencam- und Videobeobachtungen modelliert wurden. Die von Beiß- 
wenger dargestellten Problem-Typen lassen sich als Konstellationen von Ereig- 
nissen im Aktivitätskontext und am Bildschirm beschreiben. Einige Typen für 
solche problemauslösenden Ereigniskonstellationen (im Folgenden kurz: Prob- 
lemkonstellationen) werden im Folgenden exemplarisch skizziert; weitere Typen 
sollen im Rahmen einer Pilotstudie im Rahmen des Projekts auf breiterer Da- 
tenbasis identifiziert und modelliert werden (vgl. dazu Abschnitt 6.3/6.4). 

Das zentrale Problem beim Interaktionsmanagement in synchroner Schrift- 
kommunikation besteht darin, dass - im Gegensatz zu mündlichen Gesprächen 
— eine interaktive Aushandlung von Beteiligungsrollen zwischen den Beteilig- 
ten zur Laufzeit der Interaktion nur eingeschränkt möglich ist; an die Stelle der 
lokalen Organisation des Sprecherwechsels tritt, in Chat- und Talk-Kommunika- 
tion unterschiedlich prekär ausgeprägt, die Herausforderung der immer wieder 
neuen individuellen Adaption der eigenen kommunikationsbezogenen Aktivitä- 
ten an den aktuellen Stand des Bildschirmprotokolls (vgl. Abschnitt 2). Da die 
anderen Beteiligten synchron, aber unabgestimmt, Gleiches tun, besteht grund- 
sätzlich das Risiko, mit eigenen Beitragsplänen Projekte zu verfolgen, die zu 
den zeitgleich konzipierten Projekten anderer Beteiligter nicht passen (Problem 
der Handlungskoordination). Da sich das Bildschirmprotokoll permanent verän- 
dern kann, besteht das Risiko, dass während der Formulierung eines eigenen 
Beitrags neue Beiträge anderer Chatter am Bildschirm erscheinen, die, ohne 
dass der Produzierende dies unmittelbar bemerkt, den aktuell in Formulierung 
befindlichen Beitrag obsolet werden lassen; der Stand des Interaktionsverlaufs, 
auf dessen Grundlage der aktuell in Formulierung befindliche Beitrag als 
Folgebeitrag relevant und kohärent ist, entspricht in solchen Fällen nicht mehr 
dem Stand des am Bildschirm dokumentierten Geschehens und dem individuell 
konstituierten Stand des Interaktionsverlaufs in der Sicht anderer Beteiligter 
(Problem der Divergenz der individuellen Sichten auf den Stand der Interaktion). 
Als Resultat aus diesen Problemen ergibt sich das Risiko, Redundantes zu tun (= 
Beiträge zu produzieren, die zum aktuellen Stand nicht mehr benötigt werden), 
Irrelevantes zu tun (= Beiträge zu produzieren, die zum aktuellen Stand nicht 
relevant sind) oder inkohärent zu sein (= Beiträge zu verschicken, die sich an 
den aktuellen Stand nicht kohärent anschließen lassen). Typische problemaus- 
lösende Ereigniskonstellationen sind: 


1. Chatter A ist mit der Produktion eines Beitrags befasst, während ein neues 
Posting eines anderen Chatters B im Bildschirmprotokoll erscheint. Da A 
nicht aufs Protokoll blickt, nimmt er das Posting von B nicht wahr; seine 
weitere Produktion entspricht also möglicherweise der Umsetzung eines 
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Handlungsplans, der von kontextuellen Rahmenbedingungen ausgeht, die 
nicht mehr aktuell sind. 


Risikopotenzial: Der vom Chatter intendierte Beitrag wird während der 
Versprachlichung redundant, irrelevant und/oder nicht mehr kohärent 
anschließbar. 

Lösungsmöglichkeit: Sobald während der Produktion ein Posting im 
Bildschirmprotokoll erscheint, das von A noch nicht zur Kenntnis ge- 
nommen wurde, wird A technisch signalisiert, dass es ungelesene Pos- 
tings anderer Chatter im Bildschirmprotokoll gibt. 


2. Chatter A beginnt mit der Produktion eines Beitrags BA, während ein ande- 
rer Chatter B bereits mit der Produktion eines eigenen Beitrags (BB) befasst 


ist. 


Risikopotenzial: Die beiden Beiträge sind nicht aufeinander abgestimmt 
und zielen möglicherweise darauf, den von A und B zu diesem Zeit- 
punkt als aktuell wahrgenommenen Stand des Interaktionsverlaufs (der 
nicht identisch sein muss, vgl. (1) und (2)) - ohne voneinander zu wis- 
sen - auf unterschiedliche Art weiterzuentwickeln. Es besteht das Risi- 
ko einer Verzweigung des Interaktionsverlaufs in alternative Threads 
und das Risiko, dass mindestens einer der beiden Chatter einen Beitrag 
produziert, der redundant, irrelevant und/oder nicht kohärent an- 
schließbar ist. 

Lösungsmöglichkeit: Den Chattern könnte (a) signalisiert werden, dass 
der andere Chatter ebenfalls gerade produziert, und (b) live in einem 
Bereich des User-Interface, der auch bei momentanem visuellen Fokus 
auf dem Eingabefeld wahrnehmbar ist, angezeigt werden, was der an- 
dere gerade produziert. Das ermöglicht es dem aktuell Produzierenden 
zu evaluieren, ob der vom anderen verfolgte Handlungsplan die Umset- 
zung des eigenen Handlungsplans gefährdet. Es könnte eine technische 
Option bereitgestellt werden, dem anderen zu signalisieren, dass man 
ihm „Vorfahrt“ gewährt und mit der weiteren Umsetzung des eigenen 
Plans wartet, bis der andere seinen Beitrag als Posting verschickt hat. 
Auf diese Weise könnte im Falle konkurrierender, unabgestimmter Bei- 
tragsvorhaben lokal ein Pendant zum Turn-taking in mündlichen Ge- 
sprächen reinstalliert werden. Der Chat wechselt in solchen Fällen 
dann in einen der Talk-Kommunikation nachempfundenen Modus, der 
aber nur für die beiden Konfliktpartner zur Verfügung steht und der da- 
zu dient, noch vor der Repräsentation der intendierten Postings im 
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Bildschirmprotokoll Fälle paralleler Produktion und daraus erwach- 
sende Sequenzierungsprobleme zu bearbeiten. 


3. Ein Chatter bezieht sich mit einem Beitrag nicht auf einen ihm während der 
Produktion bereits bekannten Partnerbeitrag, der seinem Beitrag im Bild- 
schirmprotokoll unmittelbar vorangeht, sondern auf Beiträge, die im Bild- 
schirmprotokoll weiter zurückliegen. Er gestaltet seinen Beitrag sprachlich 
so, als sei er zu den gewählten Bezugsbeiträgen adjazent. An derjenigen 
Stelle im Protokoll, in der sein Beitrag nach der Verschickung angezeigt 
wird, ist eine Zuordnung zu den Bezugsbeiträgen aufgrund fehlender Adja- 
zenz für die Partner nicht unmittelbar möglich. 

—  Risikopotenzial: Die sequenzielle Einordnung des Beitrags sowie seine 
thematischen Bezüge auf die Vorkommunikation können von den 
Kommunikationspartnern in der Rezeption nicht zweifelsfrei oder nur 
mit zusätzlichem Lese- und Interpretationsaufwand konstituiert wer- 
den. 

—  Lösungsmöglichkeit: Durch Auswertung der Eyetracking-Daten wird 
ermittelt, welche Beiträge am Bildschirm als Bezugsbeiträge für den ak- 
tuell in Produktion befindlichen Folgebeitrag eines Chatters in Frage 
kommen. Anzunehmen wäre z.B., dass Beiträge, auf die man sich be- 
zieht, vor Beginn der Produktion des Folgebeitrags entweder zuletzt 
und/oder besonders intensiv betrachtet bzw. gelesen wurden (s. hierzu 
die Beispielanalyse in Abschnitt 6.4). Lässt sich diese Annahme an Da- 
ten bestätigen, könnte den Chat-Partnern im Bildschirmprotokoll durch 
Verbindungslinien für jeden verschickten Beitrag angezeigt werden, 
welche der Vorbeiträge als vermutete Bezugsbeiträge in Frage kommen. 
Auf diese Weise wird systemseitig ein automatisches Threading gene- 
riert, das die Rekonstruktion der von den Produzenten intendierten se- 
quenziellen Bezüge unterstützt. 


Datenbeispiele für die Problemkonstellations-Typen (1) und (2) finden sich in 
Beißwenger (2007, 2010, 2016), ein Beispiel für Typ (3) aus den Daten des Ebiss- 
Projekts wird in Abschnitt 6.4 vorgestellt und analysiert. 
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5 Machbarkeitsstudie 


In der Machbarkeitsstudie sollte zum einen die Tauglichkeit der verwendeten 
technischen Plattform für den Einsatz im realen Studienbetrieb getestet werden. 
Zum anderen sollten Fragestellungen der Linguisten, welchen Einfluss ver- 
schiedene Oberflächendesigns synchroner Textkommunikation auf die Struktur 
von Diskussionen haben, beantwortet werden. Die Studie wurde in Zusammen- 
arbeit mit dem Institut für deutsche Sprache und Literatur an der TU Dortmund 
durchgeführt (Kienle et al. 2013a). 


5.1 Technik: INKA-Suite 


Für grundlegende Studien zur automatischen Identifizierung von Kommunika- 
tionsmustern und Erprobung von attentive user interfaces steht mit der INKA- 
Suite (Kienle et al., 2013b) eine integrierte Testumgebung zur Verfügung, die 
das Eyetracking synchroner schriftbasierter Kommunikation ermöglicht. Sie 
bietet einerseits die Möglichkeit, mit wenig Programmieraufwand beliebige 
Bildschirmoberflächen für synchrone schriftbasierte Kommunikation zu gestal- 
ten und diese nachträglich in einer kontrollierten Umgebung im Rahmen von 
Studien zu verwenden. Dabei werden jegliche Kommunikationsdaten (Nach- 
richten, Keystrokes, Mausbenutzung) sowie Audio und Video aller Probanden 
aufgezeichnet. Andererseits steht eine Komponente zur Analyse dieser erhobe- 
nen Kommunikationsdaten für die Entdeckung von Kommunikationsmustern 
zur Verfügung. Durch eine direkte Verknüpfung von Elementen der grafischen 
Benutzeroberfläche mit den Blickdaten des Benutzers können sogenannte Areas 
of Interest (AOIs), wie z.B. die einzelnen Beiträge im Protokollbereich und das 
Eingabefeld, performant zur Laufzeit identifiziert werden - unabhängig von 
Größe, Form und aktueller Position. Ein nachträglicher manueller Identifizie- 
rungsaufwand entfällt und es kann sofort mit der Auswertung begonnen wer- 
den. 
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Abb. 1: INKA-Suite (Kienle et al. 2013b) 
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Die Analysekomponente dient der Aufbereitung der aufgezeichneten Daten und 

ermöglicht unterschiedliche Auswertungsdimensionen. Dazu stehen drei Dar- 

stellungsarten zur Verfügung, zwischen denen beliebig gewechselt werden 
kann. So ist ein umfassender Blick auf die erhobenen Daten möglich: 

1. Eine Timeline (vgl. Abb. 1, untere Bildhälfte) wird vor allem den Anforde- 
rungen an die Erkennung von Kommunikationsmustern gerecht. An einem 
Zeitstrahl mit frei wählbarem Maßstab werden detailliert alle Freignisse ei- 
ner synchronen schriftbasierten Kommunikation aufgeführt. Dabei können 
beliebig viele Probanden gleichzeitig dargestellt werden. 

2. Das Replay stellt eine Wiedergabe der aufgezeichneten Kommunikation zur 
Verfügung, um qualitative Auswertungen durchzuführen (vgl. Abb. 1, obere 
Bildhälfte). Dabei wird jedoch nicht auf eine Bildschirmaufnahme zurück- 
gegriffen, sondern die Kommunikation real nachgestellt. Dies hat den Vor- 
teil, Inhalte und vor allem Zusatzinformationen dynamisch ein- und aus- 
blenden zu können. 

3. Die Statistik stellt eine tabellarische Auswertung mit Exportfunktion dar 
und wird in gängigen Auswertungswerkzeugen eingesetzt. Sie dient in ers- 
ter Linie dazu, Parameter der einzelnen Probanden komfortabel gegenüber- 
zustellen. 


5.2 Studiendesign 


In der Studie wurden insgesamt zehn Gruppen aufgezeichnet. Dabei wurden 
Tests nicht nur mit Bezug zum Oberflächendesign, sondern auch zur Verwen- 
dung unterschiedlicher Szenarien und Gruppengrößen (Dyaden und Dreier- 
Gruppen) angestrebt. In den beiden formulierten Szenarien wurden die Proban- 
den im Vorfeld mit Informationen versorgt, die in den Chats ausgetauscht wer- 
den mussten, bevor eine Lösung für das gegebene Problem gefunden werden 
konnte. Der Unterschied zwischen den Szenarien bestand darin, dass unter- 
schiedliche Mengen an Informationen zur Verfügung standen. 

Zum einen wurde eine Standard-Chat-Umgebung (siehe Abb. 2, links) mit 
einem Eingabefeld sowie Chatprotokoll und zum anderen ein sogenanntes 
Talklayout, angelehnt an Unix Talk (siehe Abb. 2, rechts), mit einem Eingabe- 
feld, einer synchronen Benutzerliste und einem Chatprotokoll erstellt. Die syn- 
chrone Benutzerliste im Talklayout ermöglicht es dem Rezipienten, die Eingabe 
des Produzenten zu sehen, noch bevor dieser seine Nachricht abgeschickt hat. 
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Abb. 2: Chatlayouts (Kienle et al. 2013a) 


Tab. 1 gibt einen Überblick über die Kombinationen aus Oberfläche, Szenario 
und Gruppengröße. Insgesamt wurden im März 2013 zehn Teams mit 26 Pro- 
bandinnen und Probanden an zwei Tagen untersucht. Die Chats dauerten je- 
weils zwischen 30 und 45 Minuten. 


Tab. 1: Probandengruppen der INKA-Studie 


Tag 1- Chat Zweier-Gruppen Dreier-Gruppen 
Szenario Eins 2 1 
Szenario Zwei 2 


Tag 2 - Talk Zweier-Gruppen 


Szenario Eins 2 


Szenario Zwei 


Dreier-Gruppen 


160 —— Kienle/Beißwenger/Cedli/Holmer/Schlieker-Steens/Schlösser 


Die Probanden einer Chatgruppierung wurden auf unterschiedliche Räume 
verteilt, um sicherzustellen, dass sie miteinander chatten und sich nicht unter- 
halten bzw. sehen können. Von den drei eingesetzten Clients waren zwei mit 
einem Eyetracker verbunden. In jedem Raum wurden die Probanden von einer 
Aufsichtsperson betreut, die zum einen bei Fragen unterstützen konnte und 
zum anderen die Qualität der Blickdaten überwachte. In Versuchsraum 1 über- 
nahm der Versuchsleiter die Rolle der Aufsichtsperson und war zudem noch für 
die Betreuung des Chat-Servers zuständig. 


5.3 Ergebnisse und Zusammenfassung 


Die Sichtung der Daten ergab, dass die Ungenauigkeit der Eyetracker ein Prob- 
lem für die automatische Analyse darstellt. Wie in Abb. 3 zu sehen, wird der 
gerade von Lina verfasste Text fokussiert, das System erkennt jedoch die ent- 
sprechende AOI nicht, da die Blickdaten räumlich darüber liegen. Somit wird 
kein Ergebnis zurückgeliefert. Es werden also einige Fixationen nicht auf der 
AOI registriert, die eigentlich angesehen wurde, da es durch Messungenauigkei- 
ten, z.B. durch äußere Einflüsse, zu einem räumlichen Versatz kommt. Für wei- 
tere Studien ist hier ein umfassenderer Ansatz zur AOI-Erkennung erforderlich. 
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Abb. 3: Studienergebnis (Ungenauigkeit der Eyetracker) (Kienle et al. 2013a) 


Im Verlauf der Nutzung der Analysekomponenten wurde ein zweites Problem 
sichtbar: Der durch die Replay- und Timeline-Komponente vorgegebene Be- 
trachtungszeitraum im Sekunden- bzw. Millisekundenbereich stellte sich im 
Rahmen der Analyse als ungeeigneter Einstieg zur Identifikation relevanter 
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Abschnitte heraus. Im Hinblick auf umfangreichere Studien ist zum Beispiel 
eine aggregierte Sicht im Minutenbereich auf die Daten erforderlich, die eine 
Übersicht über eine Studienaufnahme ermöglicht. 

Zusammenfassend konnte im Rahmen der Machbarkeitsstudie gezeigt wer- 
den, dass eine synchrone Aufzeichnung multimodaler Daten mit der techni- 
schen Umgebung der INKA-Suite möglich ist. Bei Sichtung dieser Daten stellte 
sich jedoch der Bedarf für eine umfassendere AOI-Erkennung sowie eine zusätz- 
liche Visualisierung der Daten im Minutenbereich heraus. 


6 Das DFG-Projekt Eyetrackingbasiertes 
Interaktionsmanagement synchroner 
Schriftkommunikation (Ebiss) 


6.1 Projektidee 


Ziel des Projektes ist es, die Voraussetzungen zu schaffen, um Eyetracking als 
innovative Mensch-Maschine-Schnittstelle für die Unterstützung synchroner 
schriftbasierter Kommunikation einsetzen zu können. Durch die Kombination 
mit anderen Sensordaten (z.B. Keystroke-Logging) und auf Basis bekannter und 
neu zu identifizierender Kommunikationsmuster, werden Verfahren entwickelt, 
die zur Laufzeit das Entstehen solcher Muster in der Kommunikation erkennen 
und durch Einsatz geeigneter Interaktionselemente auf der Bildschirmoberflä- 
che unerwünschte Muster nach Möglichkeit umgehen. Die Verfahren werden 
evaluiert und in Form von Gestaltungsempfehlungen nutzbar gemacht. Die 
Ergebnisse des Projekts werden die Grundlagenforschung in zwei Bereichen 
voranbringen: 

1. Grundlagenforschung zu Besonderheiten des Interaktionsmanagements 

in synchroner schriftbasierter Kommunikation: 

- Empirisch fundierte Beschreibungen zu typischen Problemkonstel- 
lationen beim Interaktionsmanagement in synchroner schriftbasier- 
ter Kommunikation und empirisch fundierte Erarbeitung einer Ty- 
pologie solcher Konstellationen. 


2. Grundlagenforschung im Bereich der Entwicklung eyetrackingbasierter 
Kommunikationstools: 

= Entwicklung von Verfahren zur automatischen Erkennung typi- 

scher Problemkonstellationen zur Laufzeit der Interaktion, die Eye- 
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tracking-Daten zur Laufzeit der Interaktion erheben, auswerten und 
auf der Bildschirmoberfläche in Form von Funktionen zur Unter- 
stützung des Interaktionsmanagements zur Verfügung stellen. 

= Empirisch fundierte Gestaltungsempfehlungen für synchrone 
schriftbasierte Kommunikationstools, die den Nutzern zur Laufzeit 
der Interaktion auf dem Systeminterface Hilfestellungen bereitstel- 
len, um typische Problemkonstellationen zu erkennen und indivi- 
duell oder interaktiv zu bearbeiten. 


Die anvisierten Hilfsfunktionen basieren auf dem Konzept des attentive user 
interface (Buscher et al. 2012), das die Benutzer aktiv beobachtet und dessen 
implizite Aktionen interpretiert und geeignet mit Hilfe von zusätzlichen Interak- 
tionselementen reagiert. Dabei werden die verschiedenen Datenströme wie 
Keystrokes, Mausbewegungen und Eyetracking-Daten aller Teilnehmer inte- 
griert und darin nach bekannten Typen von Problemkonstellationen gesucht. 
Ist ein charakteristisches Muster identifiziert, werden entsprechend program- 
mierte Aktionen wie zum Beispiel die Markierung nicht gelesener Beiträge ge- 
startet. 


6.2 Technik: INKA-Suite 2.0 


Die in der Machbarkeitsstudie verwendete technische Plattform INKA-Suite 
wurde auf die Verwendung von Webtechnologien mit den dort üblichen offenen 
Protokollstandards sowie Datenformaten portiert, um eine höhere Kompatibili- 
tät zu gewährleisten. Dieser Schritt war außerdem erforderlich, um das Ausse- 
hen und die Handhabung (engl. Look and Feel) bekannter Chatumgebungen, 
die vorrangig im Webbrowser verwendet werden, entsprechend nachbilden zu 
können. Durch die Fülle an bereits verfügbaren Open-Source-Bausteinen kann 
so zudem ein effizienterer Entwicklungsablauf für Oberflächen gewährleistet 
werden. 

Dem in der Machbarkeitsstudie gefundenen und in den Ergebnissen be- 
schriebenen Problem der Eyetracking-Ungenauigkeit wurde durch eine erwei- 
terte Identifizierung der AOIs begegnet. Dabei werden die Abstände zu allen 
umliegenden AOls berechnet, mit dem im Nachgang der wahrscheinlichste 
Treffer bestimmt werden kann. Eine hundertprozentige Genauigkeit kann auf- 
grund von technischen Beschränkungen seitens der Eyetracking-Hardware 
jedoch nicht garantiert werden. 

Die bestehenden Analysewerkzeuge wurden enger verknüpft und nach den 
Erfahrungen in der Machbarkeitsstudie weiter ausgebaut: 
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1. Das Replay sowie die Timeline wurden zu einer einzelnen Wiedergabe- 
Komponente (s. Abb. 4) zusammengefügt, die zeitgleich alle Benutzer- 
und Bildschirmvideos, Blick- und Interaktionsdaten visualisiert. Außer- 
dem wurden umfangreichere Möglichkeiten zur Annotation der Daten rea- 
lisiert. 

2. Die Statistik-Komponente wurde im Hinblick auf die Vergleichbarkeit 
zwischen einzelnen oder gruppierten Studienaufnahmen erweitert. Dabei 
wurden weitere auf Blickdaten basierende Kennzahlen eingeführt. 

3. Eine zusätzliche Komponente wurde entwickelt, die die Vielzahl der auf- 
gezeichneten Daten zu Kennzahlen in einem vorgegebenen Betrachtungs- 
zeitraum aggregiert und so das oben beschriebene Problem der feinen 
Granularität der Wiedergabe-Komponente löst. Diese Komponente soll 
den Einstieg in die echtzeitbasierte Analyse der Wiedergabe-Komponente 
erleichtern, indem aus der Vogelperspektive potenziell relevante Zeitab- 
schnitte identifiziert werden. Darunter sind Merkmale wie zum Beispiel 
ein rapider Anstieg von Interaktionsdaten mehrerer Probanden oder die 
Abnahme der durchschnittlichen Fixationslänge eines Probanden zu fas- 
sen. 
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Abb. 4: Wiedergabe-Komponente der INKA-Suite 2 
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6.3 Studiendesign 


Die Laborstudie 1 des Ebiss-Projekts fand im Juli 2015 im Zeitraum von zwei 
Wochen statt. Dabei nahmen insgesamt 72 Probandinnen und Probanden an der 
Studie teil, die in dyadische und triadische Gruppen eingeteilt wurden. 


Tab. 2: Probandengruppen in der Ebiss-Studie 


Zeichenbasiert Beitragsbasiert 

2er 3er 2er 3er 
Filmpreis 1 1 3 2 
Anwesenheitspflicht 2 2 4 4 
Lebensmittelampel 2 2 


Es wurden jeweils drei unterschiedliche Settings eingesetzt: ein Aushandlungs- 
diskurs, bei dem die Probanden als Mitglieder einer Filmpreis-Jury aus einer 
Liste vorgegebener Kandidaten eine Top-3-Auswahl von Regisseuren treffen 
sollten, die einen Filmpreis für ihr Lebenswerk verliehen bekommen sollen; 
eine Diskussion über das Für und Wider von Anwesenheitspflicht an der Hoch- 
schule aus dem Blickwinkel einer Kommission, die als Ergebnis ihrer Beratun- 
gen abschließend ein gemeinsames Pro- oder Contra-Plädoyer zur Anwesen- 
heitspflicht abgeben sollte; eine Diskussion der Vor- und Nachteile von 
Lebensmittelampeln auf Nahrungsmitteln, die die Perspektiven verschiedener 
Stakeholder (Wissenschaftler, Konzerne Verbraucher) einbeziehen sollte. Das 
Filmpreis-Szenario wurde von Michael Beißwenger konzipiert und zuvor schon 
mehrfach mit studentischen Probanden erprobt; die beiden anderen Szenarien 
wurden für die Studien in Ebiss neu konzipiert. 

Zur Vorbereitung auf die Studie wurden sowohl zeichenbasierte als auch 
beitragsbasierte Systeme erprobt, die auf demselben Interface basieren. Dabei 
sollte das Interface so realisiert werden, dass es die Probanden an derzeit gän- 
gige Chat-Interfaces erinnert und möglichst intuitiv angeeignet werden kann. 
Bei der Festlegung des Interface-Designs wurden Eigenschaften und Funktio- 
nen der Interfaces verschiedener gängiger Chat- und Messaging-Systeme erho- 
ben und daraus eine Auswahl der gängigsten Features getroffen. 

Die Sessions waren für maximal eine Stunde konzipiert: 30 Minuten für Vor- 
und Nachbereitungen — wie beispielsweise Kalibrierung der Eyetracker, Unter- 
zeichnen von Einverständniserklärungen, Lesen der Instruktionen und Ausfül- 
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len eines Personalfragebogens und des standardisierten User Experience Ques- 
tionnaire (UEQ) - sowie 30 Minuten fürs Chatten. Um sicherzustellen, dass sich 
die Probanden während der Chatsessions weder sahen noch unterhielten, wur- 
den sie in getrennten Räumen untergebracht. Jeder Proband wurde dabei von 
einer Aufsichtsperson betreut, die einerseits bei Fragen behilflich war und an- 
dererseits die Blickdaten der jeweiligen Probanden kontrollierte. 

Im Anschluss an die jeweiligen Sessions wurden die Probanden gebeten, 
sowohl einen allgemeinen Fragebogen als auch einen UEQ auszufüllen, um u.a. 
eine Rückmeldung zur Bedienbarkeit und zum Design zu erhalten. Die Auswer- 
tung des UEQ hinsichtlich der Einschätzung zum Chatinterface seitens der Pro- 
banden ergab, dass Durchschaubarkeit, Fffizienz und Steuerbarkeit sowohl bei 
zeichenbasierten als auch bei beitragsbasierten Systemen als überdurchschnitt- 
lich bis exzellent bewertet wurden.’ Attraktivität, Simulation und Originalität 
hingegen wurden bei beiden Systemen unterdurchschnittlich bis schlecht ein- 
gestuft. Auffällig ist hierbei, dass hinsichtlich der Durchschaubarkeit sowohl 
bei den Zweier-Gruppen der zeichenbasierten als auch bei den Zweier-Gruppen 
der beitragsbasierten Systeme herausragende Werte erreicht wurden. Insgesamt 
legen die Werte nahe, dass die Zielsetzung - ein Interface zu konzipieren, das 
den Erwartungen an eine Standard-Chat-Umgebung gerecht wird -— erreicht 
wurde. 

Bei den Probanden handelte es sich großenteils um Studierende. Das durch- 
schnittliche Alter lag bei 24 Jahren; 60 Prozent waren weiblichen und 40 Pro- 
zent männlichen Geschlechts. 82% der Probanden hatten die Muttersprache 
Deutsch. 77% der Nicht-Muttersprachler schätzten ihre Deutschkenntnisse als 
gut bis sehr gut, 23% als durchschnittlich ein. 


6.4 Beispielanalyse: Aufdeckung typischer 
Problemkonstellationen durch Einbeziehung von 
Eyetracking-Informationen 


Erste Auswertungen zu den im Rahmen von Studie 1 erhobenen Daten bestäti- 
gen die Relevanz der in Abschnitt 4 skizzierten Problemkonstellations-Typen (1) 
und (2), die auch schon in den Labordaten der Studie Beißwenger (2007) darge- 
stellt werden konnten. Während in der Erhebung von Beißwenger lediglich 
grobe Blickrichtungsziele erfasst wurden (Tastatur, Bildschirmprotokoll, Text- 


3 Durchschaubarkeit, Effizienz und Steuerbarkeit sind in UEQ Kriterien für die Bewertung der 
Nutzererfahrung (vgl. http://www.ueq-online.org/). 
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eingabefeld), erlaubt die Nutzung des Eyetrackers dabei eine feinkörnige Zu- 
ordnung des Blickverhaltens zu einzelnen Beiträgen sowie Aussagen darüber, 
wann ein Beitrag nur angesehen und wann er gelesen wurde (Abb. 5). 


Gruppenchat 
Tim, Jan, Alexis 


Meine drei sind alle breits verstorben 


Gesellschaftskritischer Regisseur 


Absenden 


Abb. 5: Charakteristisches Eyetracking-Muster beim Lesen eines Partnerbeitrags: Über die 
grafische Darstellung des Beitrags verteilt finden sich in Leseverlaufsrichtung mehrere aufei- 
nanderfolgende Fixationen. 


Die Möglichkeit, für jeden Beitrag am Bildschirm bestimmen zu können, wann, 
wie oft und wie lange er von einem Chatter wahrgenommen und gelesen wurde, 
ermöglicht es, darüber hinaus weitere Typen von Problemkonstellationen auf- 
zudecken, die mit der Abfolge bei der Rezeption von Beiträgen am Bildschirm 
und mit der darauf bezogenen Planung individueller Folgebeiträge zu tun ha- 
ben. So finden sich in den Daten Fälle, in denen Chatter mit der Konzeption und 
Gestaltung eigener Beiträge nicht an den zuletzt wahrgenommenen Stand des 
Bildschirmprotokolls anschließen, sondern an Partnerbeiträge im Protokoll, die 
schon etwas weiter zurückliegen. Die Chatter machen hier vom materialen 
Mehrwert schriftlicher Kommunikation Gebrauch, Äußerungen in selbstgewähl- 
ter Abfolge und ggf. mehrfach zu rezipieren und den Kontext für eigene An- 
schlussbeiträge über die individuelle Leseabfolge zu konstituieren anstatt den 
letzten wahrgenommenen Stand des Bildschirmprotokolls als Kontext für die 
Produktion eigener Beiträge zugrunde zu legen. 

Diese Strategie zur individuellen Koordination von Rezeption und Produk- 
tion ist für den Chatter insofern komfortabel, als er sich damit nicht dem Diktat 
des jederzeit veränderlichen letzten Stands der Interaktion am Bildschirm un- 
terwirft. Handlungsleitend ist in diesem Fall nicht, wie im Falle des von Beiß- 
wenger (2007: Kap. 6) untersuchten Strategietyps „Löschen und Neuproduzie- 
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ren“, den aktuell produzierten Beitrag immer möglichst so zu gestalten, dass er 
an den letzten angezeigten Stand anschließbar ist. Handlungsleitend ist viel- 
mehr, einen einmal gefassten Handlungsplan angemessen umzusetzen und erst 
im Anschluss auf zwischenzeitlich neu erschienene Beiträge im Bildschirmpro- 
tokoll einzugehen. Dieser Strategietyp birgt allerdings das Risiko, dass Beiträge 
nach ihrer Verschickung von den Partnern nur mit Mühe oder nicht zweifelsfrei 
thematisch und sequenziell zugeordnet werden können. Da sie in ihrer Gestal- 
tung nicht auf den letzten Stand des Bildschirmprotokolls abgestimmt sind, 
besteht die Gefahr, dass die Rekonstruktion ihres Bezugs auf den vom Produ- 
zenten intendierten Bezugsbeitrag durch zwischenzeitlich neu in die Anzeige 
gekommene weitere Beiträge erschwert wird. 

Abb. 6 zeigt den ersten Teil des Logfiles aus einem Chat mit den drei Pro- 
banden Tim, Jan und Alexis, die im Rahmen der ersten Ebiss-Laborstudie das 
Filmpreis-Szenario (vgl. Abschnitt 6.3) bearbeitet haben. Die Beiträge der Chat- 
ter sind mit Teilnehmernamen sowie mit Zeitstempeln im Format <Minu- 
ten:Sekunden> versehen, aus denen der Zeitpunkt ihrer Anzeige im Bildschirm- 
protokoll hervorgeht. Das Chat-Ereignis startete beim Zeitpunkt <00:00>. 

Unter Nutzung der Eyetracking-Information wurde für drei Beiträge von Jan 
(01:58, 3:18 und 6:07) durch Verbindunsslinien dargestellt, 

1. welche Beiträge anderer Chatter Jan zu Beginn der Produktionsaktivitäten 
bereits bekannt waren (= Tabellenspalte 3); 

2. welche Beiträge anderer Chatter Jan während der Produktionsaktivität (d.h. 
zwischen Beginn der Texteingabe und Verschickung des fertigen Beitrags) 
erstmalig wahrgenommen hat (= Tabellenspalte 4); 

3. welche Beiträge anderer Chatter unter Einbeziehung von Jans Blickbewe- 
gungsdaten als diejenigen Beiträge identifiziert werden können, die Jan als 
sequenziellen und thematischen Kontext für seinen Folgebeitrag gewählt 
hat (unabhängig davon, ob ihm die betreffenden Beiträge zuvor schon be- 
kannt waren oder nicht) (= Tabellenspalte 1). 


In allen drei Fällen sind, während Jan seinen Beitrag produziert hat, neue Bei- 
träge anderer Chatter ins Bildschirmprotokoll eingefügt worden. In allen drei 
Fällen hat er die neu hinzugekommenen Beiträge während seiner Produktions- 
aktivität wahrgenommen. In allen drei Fällen führt die Wahrnehmung der neu- 
en Partnerbeiträge während der Produktion nicht zu einer Änderung seiner 
Beitragsplanung; zumindest lassen sich nach Wahrnehmung der neuen Part- 
nerbeiträge keine Revisionsaktivitäten am eingegebenen Text beobachten; 
stattdessen „zieht“ Jan sein einmal begonnenes Beitragsprojekt trotz zwischen- 
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zeitlich veränderter Kontextbedingungen (= neue Beiträge im Protokoll) 
„durch“. 


Partnerbeiträge, die Beitragsabfolge im Bildschirmprotokoll Vor Beginn Prod. Zwischen Beginn + Ende 
den Kontext zu Jans bekannte Partner- Prod. wahrgenommene 
Beiträgen bilden beiträge Partnerbeiträge 


00:15 Tim: Hallo zusammen 


00:18 Jan: Hallo 


00:18 Alexis: hallo 


00:28 Tim: Dann lasst uns mal beraten wer den Preis gewinnen soll 


00:36 Tim: Wen würdet ihr denn vorschlagen? 
00:51 Jan: Meine Wahl würde auf Billy Wilder fallen 
01:05 Jan: Wie sieht das bei euch aus ? 


01:22 Alexis: das ist echt schwer, denn zu meinen lieblingsregisseuren 
gehört keiner der drei...hab von jedem maximal einen film 
gesehen... 


01:46 Tim: Interessant, Billy Wilder war gar nicht in meiner Auswahl. 
Erzähl doch mal etwas über den? 


01:58 Jan: Okay, also wenn ich nach den Aspekten gehe würde meinen 
Wahl auf keinen fallen, kenne niemanden von denen 


02:05 Alexis: in meiner auswahl war billy wilder auch nicht 


02:21 Tim: Ich glaube, dass ist nicht ausschlaggebend Alexis. Wichtig ist, 
dass wir uns auf jemanden einigen, der den Preis gewinnen kann. 


02:40 Alexis: ja schon klar 


02:50 Tim: Bei mir stehen beaknntere Regisseure zur Wahl. 


03:11 Tim: Unter anderem Woody Allen, Francis FDord Coppola und 
Martin Scrosese. 


03:16 Tim: Ich denke mal, die sagen euch was 


03:18 Jan: Also was mich halt positiv überrascht hat ist, dass er sich 
traute neues zu versuchen, er brachte Themen wie Homosexualität 
und Prostitution in seine Filme 


03:40 Jan: und das zu einer Zeit wo davon noch sehr stark Abstand 
genommen wurde 


04:14 Jan: Okay wie es aussieht haben wir verschiedene Regisseure aus 
verschiedenen Epochen 


04:23 Tim: Das ist natürlich interessant. 


04:26 Jan: Meine drei sind alle breits verstorben 


04:28 Alexis: ich kann john huston, fritz lang, und federico fellini 
vorschlagen. aber billy wilder wäre natürlich auch eine gute wahl.. 


04:34 Tim: Gesellschaftskritischer Regisseur. 


04:40 Alexis: meine auch 


05:00 Jan: Billy Wilder Ingmar Bergman und Francois Truffaut habe ich 
zur Auswahl 


05:51 Tim: Ich bin da eher für Woody Allen. Na klar, der Gute hat schon 
den ein odere anderen preis abgeräumt, allerdings hat er sich 
gerade für die europäisch-amerikanischen Film-"Freundschaft" 


verdient gemacht. 
06:07 Jan: Das macht die Sache natürlich jetzt schwerer, ich kann 


natürlich eher Leute bewerten deren Werke ich kenne 


Abb. 6: Wahrgenommene Partnerbeiträge und rekonstruierter Kontext für drei Beiträge des 
Chatters Jan. 


Mit der Produktion seines um 01:58 verschickten Beitrags hat Jan um 01:27 be- 
sonnen. Alle zu diesem Zeitpunkt im Protokoll angezeigten Beiträge hat er be- 
reits gelesen. Während der Texteingabe erscheint am Bildschirm der Beitrag Tim 
01:46, mit dem Jan explizit dazu aufgefordert wird, über Billy Wilder zu referie- 
ren. Jan liest diesen Beitrag um 01:47. Würde Jan den aktuellen Stand des Bild- 
schirmprotokolls als jeweils relevanten Kontext für die Gestaltung seines eige- 
nen Beitrags ansehen, wäre sein aktuell in Produktion befindlicher Beitrag nicht 
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optimal anschließbar; Jan lässt sich durch das Update am Bildschirm aber nicht 
beirren und fährt ohne sichtbare Modifikationen mit der Fertigstellung seines 
Entwurfs fort. Dabei passt er auch die sprachliche Gestaltung seines Beitrags 
nicht an die veränderten Kontextbedingungen an: Die definite Nominalgruppe 
„den Aspekten“ setzt für die Rekonstruktion des damit fortgeführten Themas in 
der Rezeption einen unmittelbaren Zugriff auf den Bezugsbeitrag voraus. Jan 
thematisiert damit, die von Alexis in 01:22 benannte Tatsache, dass die von ihr 
vorbereiteten Regisseure nicht zu ihren Lieblingsregisseuren gehören und sie 
von ihnen jeweils nicht mehr als einen Film gesehen habe. Da Jans Beitrag nach 
der Verschickung am Bildschirm nicht unmittelbar adjazent zu Alexis’ Beitrag 
eingeordnet wird (eine Tatsache, die für Jan nach der zwischenzeitlich erfolgten 
Rezeption des Beitrags von Tim 01:46 antizipierbar ist), wird für die Partner die 
Rekonstruktion dieser thematischen Wiederaufnahme erschwert. 

Für den Beitrag 03:18 bietet die Auswertung von Jans Eyetracking- 
Informationen ein ähnliches Bild: Der Beitrag bezieht sich thematisch auf die 
beiden vor Beginn der Produktionstätigkeit gelesenen Beiträge, 01:46 Tim und 
02:05 Alexis. Tim hat Jan dazu aufgefordert, über Billy Wilder zu referieren, da 
er selbst diesen Regisseur nicht vorbereitet hat; Alexis teilt mit, dass das bei ihr 
ebenfalls der Fall sei, woraus hervorgeht, dass auch für sie mit Blick auf die zu 
bearbeitende Aufgabenstellung Informationen über die Leistung dieses Regis- 
seurs relevant sind. Jan kommt mit seinem Beitrag 03:18 diesem Informations- 
bedürfnis nach und stellt Verdienste Wilders heraus. Zwischen dem Beginn 
seiner Produktionstätigkeit und der Verschickung des fertigen Beitrags kommen 
fünf neue Partnerbeiträge zur Anzeige: alle fünf werden von Jan während der 
Beitragseingabe wahrgenommen, ihre Rezeption führt aber zu keiner sichtbaren 
Änderung seines einmal gefassten Beitragsplans. Der anaphorische Rückbezug 
von „er“ auf „billy wilder“ aus den Beiträgen von Tim 01:46 und Alexis 02:05 
bleibt über die Numerus- und Genusinformation prinzipiell auflösbar; da zwi- 
schen Jans verschicktem Beitrag und den Beiträgen mit dem Bezugsthema aber 
inzwischen fünf weitere Beiträge angezeigt werden, von denen einer (Tim 03:11) 
weitere Regisseure erwähnt, ist die Rekonstruktion dieses Bezugs von den Part- 
nern nicht ohne erhöhten kognitiven Aufwand zu lösen. 

In beiden Fällen - 01:58 und 03:18 - könnte es für die Chat-Partner hilfreich 
sein, automatisch potenzielle sequenzielle Bezüge von Jans Beiträgen zur Vor- 
kommunikation angezeigt zu bekommen. Über eine Auswertung von Jans Eye- 
tracking-Informationen zur Laufzeit der Interaktion könnte in Kombination mit 
der per Keylogging ermittelten Information, dass nach der Rezeption neuer 
Partnerbeiträge keine ersichtlichen Revisionen am eingegebenen Beitragsent- 
wurf vorgenommen werden, erschlossen werden, dass die vor Beginn der Pro- 
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duktion zuletzt rezipierten Partnerbeiträgen den Kontext für seinen Folgebei- 
trag darstellen. Der Beitrag könnte dann in der Anzeige über Verbindungslinien 
zu den potenziellen Bezugsbeiträgen in Beziehung gesetzt werden. 

Auch für Jans Beitrag 06:07 bietet sich ein ähnliches Bild: Bevor er um 
05:34 mit der Produktion dieses Beitrags beginnt, liest er 34 Sekunden lang im 
Protokoll (05:00-05:34), obwohl er alle darin angezeigten Partnerbeiträge bis 
auf Alexis 04:40 bereits kennt. Die Rezeption erfolgt selbstgesteuert entgegen 
der Beitragsabfolge im Protokoll; einige Beiträge werden dabei sogar mehrfach 
mit den Augen aufgesucht und wiederholt gelesen: 


05:00-05:01 Erneuter Blick auf die Beiträge <04:34 Tim> und <04:28 Alexis> 

05:01-05:02 Erstmaliges Lesen von Beitrag <04:40 Alexis> 

05:02-05:05 Erneutes Lesen von Beitrag <04:28 Alexis> 

05:05-05:06 Erneuter Blick auf die Beiträge <04:34 Tim> und <04:40 Alexis> 

05:06-05:21 Erneutes Lesen der Beiträge <04:28 Alexis>, <04:34 Tim> und 
<04:40 Alexis> (und des eigenen Beitrags <04:26 Jan>) 

05:21-05:23 Zurückscrollen im Protokollverlauf 

05:23-05:31 Erneutes Lesen der Beiträge <03:11 Tim>, <03:16 Tim>, <02:50 
Tim> und <02:40 Alexis> 


Insgesamt werden die Beiträge <03:11 Tim> und <04:28 Alexis> während der 
gesamten Rezeptionsphase am intensivsten rezipiert (= am häufigsten mit den 
Augen aufgesucht und am längsten betrachtet). Diese beiden Beiträge kommen 
nach Interpretation der am Bildschirm angezeigten (und im Logfile dokumen- 
tierten) Sequenz am ehesten als thematischer Anknüpfungspunkt und sequen- 
zieller Kontext für Jans Beitrag 06:07 in Frage; mit dem anadeiktischen „das“ 
(„Das macht die Sache natürlich jetzt schwerer...“) bezieht er sich auf den Sach- 
verhalt, dass Tim (s. 03:11) und Alexis (s. 04:28) andere Regisseure vorbereitet 
haben als er selbst (s. Jan 05:00), und sagt dazu aus, dass er aufgrund man- 
gelnder Kenntnisse über deren Wirken und Werk zu diesen kaum eine qualifi- 
zierte Einschätzung abgeben könne (,,... ich kann natürlich eher Leute bewerten 
deren Werke ich kenne“). Während der Produktion (05:54-06:02) entdeckt und 
liest er den zwischenzeitlich neu im Protokoll angezeigten Beitrag <05:51 Tim>, 
nimmt daraufhin an seinem Beitragsentwurf aber keine sichtbare Modifikation 
vor. Thematisch wird sein Beitrag durch das Erscheinen von <05:51 Tim> nicht 
irrelevant; das anadeiktische „das“ lässt sich auch auf <05:51 Tim> beziehen, 
ursprünglich intendiert ist aber nicht nur die Wiederaufnahme des Themas 
‚Woody Allen’, sondern des weiter gefassten Themas ‚Die Chatpartner haben 
andere Regisseure vorbereitet als ich selbst’. 
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Im Falle des Beitrags von Jan 06:07 ergeben sich diejenigen Beiträge der 
Vorkommunikation als Bezugsbeiträge, die in der vorangehenden Rezeptions- 
phase am intensivsten rezipiert wurden. Eine Herausforderung für die weitere 
Arbeit im Projekt wird darin bestehen Verfahren zu implementieren, die es er- 
möglichen, zur Laufzeit der Interaktion automatisch Hypothesen darüber auf- 
zustellen, was die potenziellen Bezugsbeiträge für in Produktion befindliche 
Chatter-Beiträge sind, und die entsprechenden Bezüge auf dem Nutzer-Interface 
in Form von (z.B. grafisch realisierten) Kontextualisierungs- bzw. Kohärenzbil- 
dungshilfen anzuzeigen. 


7 Zusammenfassung und Ausblick 


Dieser Beitrag beschäftigte sich an der Schnittstelle zwischen Linguistik und 
Informatik mit dem Interaktionsmanagement in synchroner Schriftkommunika- 
tion. Diese Arbeiten wurden in dem DFG-Netzwerk Empirische Erforschung 
netzbasierter Kommunikation (Empirikom) ständig diskutiert und sukzessive 
weiterentwickelt. In dem Beitrag wurden zunächst die Bedingungen des Inter- 
aktionsmanagements in synchroner Schriftkommunikation und die charakteris- 
tischen Unterschiede zum mündlichen Gespräch dargestellt. Dabei wurde ins- 
besondere auf die Eigenschaften von Chat und Talk eingegangen. 

Anschließend wurde der Lösungsansatz des Eyetrackings als zusätzliche In- 
formationsquelle beleuchtet. Es wurde deutlich gemacht, dass sich der Einsatz 
von Eyetracking-Daten bei der Unterstützung synchroner Schriftkommunikati- 
on bisher auf die Übertragung des aktuellen Blickpunktes (Gaze Sharing) be- 
schränkt. Dies reicht allerdings nicht aus, denn es kommt nicht allein auf den 
aktuellen Blickpunkt, sondern vor allem auf den Aktivitätskontext an, in dem 
eine Fokussierung stattfindet. Dies wurde in Vorarbeiten deutlich, die die Ana- 
lyse des Aktivitätskontextes und das Erkennen von Problemen der Handlungs- 
koordination in der Chat-Kommunikation adressierten. Zur Verdeutlichung der 
problemauslösenden Ereigniskonstellationen bzw. Problemkonstellationen 
wurden in diesem Beitrag exemplarisch einige Typen skizziert. Basierend auf 
diesen Überlegungen konnte dann das Ziel formuliert werden, dass Chatter auf 
Grundlage von Problem-Prognosen, die zur Laufzeit der Interaktion identifiziert 
werden, durch die Bereitstellung technischer Funktionen auf dem User- 
Interface bei der Vermeidung bzw. Bearbeitung der prognostizierten Probleme 
zu unterstützen. 

Daran anknüpfend demonstrierte die Beschreibung einer Machbarkeitsstu- 
die die Einsatztauglichkeit der technischen Plattform INKA-Suite als Basis der 
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Gestaltung und Analyse des eyetrackingbasierten Interaktionsmanagements in 
synchroner Schriftkommunikation. Schließlich wurde auf das DFG-Projekt Ebiss 
eingegangen, das aus den Vorarbeiten entstand und sich mit Eyetracking als 
innovative Mensch-Maschine-Schnittstelle für die Unterstützung synchroner 
Schriftkommunikation beschäftigt. Hier wurden zunächst die eingesetzte Platt- 
form INKA Suite 2.0, das Studiendesign und erste quantitative Ergebnisse vor- 
gestellt. Anschließend wurde sehr ausführlich auf die Möglichkeit der Aufde- 
ckung typischer Problemkonstellationen durch Einbeziehung von Eyetracking- 
Informationen eingegangen. 

Eine Herausforderung für die weitere Arbeit im Projekt Ebiss besteht darin 
Verfahren zu implementieren, die es ermöglichen, zur Laufzeit der Interaktion 
automatisch Hypothesen darüber aufzustellen, was die potenziellen Bezugsbei- 
träge für in Produktion befindliche Chatter-Beiträge sind und die entsprechen- 
den Bezüge auf dem Nutzer-Interface in Form von (z.B. grafisch realisierten) 
Kontextualisierungs- bzw. Kohärenzbildungshilfen anzuzeigen. Diese Heraus- 
forderung wird in einem Workshop mit Experten diskutiert und es werden Lö- 
sungen erarbeitet. Diese Lösungen werden in zwei weiteren Iterationen evalu- 
iert. Am Ende des Projektes Ebiss stehen dann zum einen Verfahren zur 
automatischen Erkennung typischer Problemkonstellationen zur Laufzeit der 
Interaktion und zum anderen Gestaltungsempfehlungen für Tools synchroner 
Schriftkommunikation, die den Nutzern zur Laufzeit der Interaktion auf dem 
Systeminterface Hilfestellungen bereitstellen, um typische Problemkonstellati- 
onen zu erkennen und individuell oder interaktiv zu bearbeiten. 
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Steffen Pappert 
Zu kommunikativen Funktionen von Emojis 
in der WhatsApp-Kommunikation 


1 Einführung: WhatsApp-Kommunikation 


„Mehr als 90 Prozent derer, die im Netz kommunizieren, nutzen Emojis und 
Emoticons. Doch was wollen und können sie uns damit sagen?“ (Anderl 2017). 
Solche und vergleichbare Aufhänger findet man allenthalben - in (Online-) 
Zeitungen und Zeitschriften, vom SPIEGEL bis zur Bild der Frau. Emojis sind 
demzufolge in aller Munde. Aus linguistischer Perspektive „lassen [sie] sich mit 
einiger Berechtigung als das sprachliche Merkmal digitaler Kommunikation par 
excellence beschreiben“ (Beißwenger 2016b: 15; Hervorhebung i.Orig.) und tra- 
gen mithin in hohem Maße zur Ausprägung typischer multimodaler' Ge- 
brauchsmuster bei. Dem in der massenmedialen Berichterstattung gespiegelten 
öffentlichen Interesse an und dem vielfältigen Gebrauch von Emojis in der in- 
ternetbasierten Kommunikation stehen bislang nur wenige linguistische Unter- 
suchungen gegenüber, die sich - bisweilen lediglich en passant — mit dem Ge- 
brauch der kleinen Bildzeichen auseinandersetzen (Dürscheid 2016; 
Dürscheid/Frick 2014, 2016; Arens 2014; Hinz 2015; Siever 2015; Imo i.V.; Sie- 
benhaar i.Dr.). Gleichwohl wird von den verschiedenen Autorinnen und Auto- 
ren das angesprochene Desiderat durchaus erkannt und benannt. So betont Imo 
(i.V), dass bei der Forschung zur multimodalen Interaktion über Kurznachrich- 
ten u.a. die „Bandbreite an Funktionen“ von Emojis in den Blick zu nehmen sei. 
Dürscheid (2016: 459) plädiert vor dem Hintergrund der unterschiedlichen se- 
miotischen Ressourcen in digitaler Schriftlichkeit dafür, diese nicht nur in ihrer 
Systematik zu beschreiben, „sondern auch hinsichtlich ihrer pragmatischen 
Funktion genauer zu betrachten“. Diese Lücke will der folgende Beitrag zumin- 
dest ansatzweise schließen. Präsentiert wird eine qualitativ-empirische Studie 
zu den Funktionen von Emojis, und zwar in der WhatsApp-Kommunikation. 


1 Mit dem Ausdruck multimodal beziehe ich mich darauf, dass die geschriebene Sprache in der 
WhatsApp-Kommunikation bei weitem nicht der einzige Informationsträger ist, sondern häufig 
„in weitere Modi eingebettet“ wird (Schmitz 2015: 25), zu denen als kleine stehende Bilder auch 
Emojis zu rechnen sind, die wiederum in spezifischer Weise auf den Sprach-Bild-Gebrauch 
einwirken (können). 
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WhatsApp ist der zurzeit meistgenutzte Messengerdienst, der von mehr als 
einer Milliarde Menschen genutzt wird. Pro Tag werden 42 Milliarden Nachrich- 
ten, 1,6 Milliarden Fotos und 250 Millionen Videos verschickt.’ Im Gegensatz zur 
internetbasierten Kommunikation in Foren, Blogs, Twitter, Facebook oder Ins- 
tagram stellt WhatsApp „eine private, nicht-öffentliche Kommunikationsform“ 
(Imo in diesem Band) dar, die medial bedingte Besonderheiten aufweist, die 
wiederum einen nicht unwesentlichen Einfluss auf das Interaktionsverhalten 
der Beteiligten haben (vgl. Imo 2015a, i.V.; Dürscheid/Frick 2014; König 2015; 
Wyss/Hug 2016; mit didaktischem Fokus: Beißwenger 2016c). Bei der 
WhatsApp-Kommunikation handelt es sich demzufolge um eine Form mobiler 
computervermittelter Kommunikation, d.h. sie weist Ähnlichkeiten zur SMS- 
aber auch zur Chat-Kommunikation auf. Mit beiden teilt sie die Eigenschaft, 
„quasi-synchrone“ (Dürscheid 2003) beziehungsweise „synchrone, aber nicht 
simultane“ (Beißwenger 2007: 35-37) Interaktionen zu ermöglichen. Im Gegen- 
satz zur SMS-Kommunikation gehört WhatsApp-Kommunikation jedoch zur 
internetbasierten Kommunikation (vgl. Imo in diesem Band), vom (traditionel- 
len) Chat (Beißwenger 2007) unterscheidet sie sich durch ihre Mobilität. Zu- 
sammenfassen lassen sich die Merkmale der Kommunikationsform folgender- 
maßen (nach Imo 2015a: 7): 


Merkmale der Kommunikationsform WhatsApp 


Zeichentyp: geschriebene Sprache; Bild; Audio; Video 
Kommunikationsrichtung: dialogisch 

Anzahl der Kommunikationspartner: oft 2, aber variabel 

räumliche Dimension: Distanz 

zeitliche Dimension: quasi-synchron 
Kommunikationsmedium: Smartphone (mobil) 


Dialogizität, Quasi-Synchronizität und Mobilität sind Voraussetzungen, die 
darauf hindeuten, dass die WhatsApp-Kommunikation weniger als Austausch 
von Textnachrichten, sondern vielmehr als Interaktion zu konzeptualisieren ist. 
Zugrunde gelegt wird hier der von Imo (2013: 51-83) begründete Interaktions- 
begriff. So liegt eine Interaktion vor, wenn zwei oder mehr Personen über Spra- 


2 http://www.sueddeutsche.de/digital/messenger-whatsapp-hat-mehr-als-eine-milliarde- 
nutzer-1.2845262 am 02. Februar 2016 [28.11.2016]. 
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che eine Situation gemeinsam generieren, kontinuieren und modifizieren und 
die jeweiligen Äußerungen sequenziell aufeinander bezogene sind und somit 
„schrittweise geteilter Sinn entsteht“ (Imo 2013: 57). Imo (2013, 2016, i.V., in 
diesem Band) stützt sich bei der Bestimmung des Interaktionsbegriffes auf die 
von Linell (1998) dargelegten Parameter für interaktionale Kommunikation, und 
überprüft diese in einem zweiten Schritt auf ihre Applikabilität auf Formen der 
Kurznachrichtenkommunikation, wie wir sie bei SMS- oder WhatsApp- 
Interaktionen vorfinden. Dabei handelt es sich um die Prinzipien der Reflexivi- 
tät zwischen Sprachgebrauch und Kontext, der Sequenzialität, des gemeinsa- 
men Hervorbringens von Struktur und Bedeutung und der Kontextgebunden- 
heit von Sprache (vgl. Imo in diesem Band). Dass diese allgemeinen Prinzipien 
auch für den schriftlichen Kurznachrichtenaustausch via WhatsApp gelten, soll 
hier nicht weiter ausgeführt werden (vgl. dazu Imo in diesem Band, i.V.; Dür- 
scheid 2016). Vielmehr soll noch einmal auf die medial-pragmatischen Rah- 
menbedingungen der WhatsApp-Kommunikation und ihre Auswirkungen auf 
das Kommunikationsverhalten eingegangen werden. Von besonderer Bedeu- 
tung scheint in diesem Zusammenhang zum einen die Endlos-Darstellung der 
Nachrichten auf einem im Vergleich zu alten Geräten großen Bildschirm zu 
sein, die „die interaktionalen Bezugnahmen schon rein optisch herstellt“ (Imo 
i.V.). Zum anderen führt die Mobilität zu nahezu steter Kommunikation in jed- 
weden Lebenslagen und an allen denkbaren Orten, „was zu neuen Herausforde- 
rungen des Kontextbezugs und der Indexikalisierung von Äußerungen geführt 
hat“ (Imo i.V.). Beide Bedingungen sowie günstigere Kosten haben Auswirkun- 
gen auf bestimmte Praktiken bzw. auf das Kommunikationsverhalten als Gan- 
zes sowie auf die sprachliche/multimodale Gestaltung einzelner Beiträge. Bei- 
spielsweise führen die permanente Erreichbarkeit sowie die damit verbundenen 
Erwartungs-Erwartungen dazu, dass die „Häppchenkommunikation“ (Imo 
2015a) im Vergleich zur SMS-Kommunikation zunimmt. Damit verbunden sind 
auch Phänomene wie Sparschreibungen und Kurzformen, wie wir sie aus der 
SMS-Kommunikation kennen, aber eben auch der verstärkte Gebrauch von 
Emojis. Aufgrund ihrer mühelosen Verfügbarkeit ermöglichen Emojis ein un- 
verzügliches Reagieren, was zur Erhöhung des Interaktivitätsgrades führt, wo- 
mit der Kommunikation so etwas wie Echtzeitcharakter verliehen wird, der aber 
— analog zur Chat-Kommunikation — aufgrund der technologischen Rahmenbe- 
dingungen natürlich nur annähernd erreicht wird (vgl. Beißwenger 2016a: 287- 
289). Als weitere Konsequenz aus den geschilderten Bedingungen wären die 
‚Endlosdialoge‘ (vgl. Imo 2015a; Dürscheid 2016) zu nennen, d.h. wir finden 
vermehrt Beiträge ohne explizite Anfangs- bzw. Beendigungsfloskeln und mit 
langen ‚Gesprächspausen‘, denn die ‚Gespräche‘ können jederzeit wieder auf- 
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genommen werden. Rituelle Rahmungen werden kompensiert durch die persis- 
tente und personenbezogene Darstellung des Gesprächsverlaufs auf dem 
Smartphone-Bildschirm, es dominiert ein „Gefühl eines kontinuierlich fortlau- 
fenden Gesprächs“ (Imo 2015a: 29). Des Weiteren finden wir neue Formen des 
Kontextualisierens (vgl. Imo i.V.). Aufgrund des fehlenden gemeinsamen Wahr- 
nehmungsraumes wird der Bezug auf die Situation des Senders und/oder den 
Kommunikationsanlass mittels neuer Praktiken realisiert. Da WhatsApp den 
Einsatz von Bildern, Videos, Audios und Emojis in einer Interaktion ermöglicht 
(vgl. Herring 2015: 399), lässt sich der fehlende Wahrnehmungsraum problem- 
los kompensieren (vgl. Imo i.V.). Das hier nur in Ansätzen angedeutete Kom- 
munikationsverhalten, resultierend aus den pragmatisch-medialen Rahmenbe- 
dingungen, die der Smartphone-Kommunikation eingeschrieben sind, 
rechtfertigt es, tatsächlich von Interaktionen i.e.S. auszugehen, die freilich auf- 
grund ihrer Schriftlichkeit und Medialität entsprechende Besonderheiten auf- 
weisen, wie beispielsweise eben den häufigen Gebrauch von Emojis. Die Analy- 
se der (interaktiven) Praktiken im Allgemeinen und des Emojigebrauchs im 
Besonderen erfordert ein Instrumentarium, das sowohl „der Dynamik getippter 
Dialoge“ (Dürscheid/Brommer 2009: 16) als auch den gegenstandsbezogenen 
Charakteristika (Multimodalität) gerecht wird. Beiden Aspekten genügt aus 
meiner Sicht die Interaktionale Stilistik (Selting 1995, 1997, 2001, 2008), in de- 
ren Rahmen Emojis als ikonostilistisch? realisierte Kontextualisierungshinweise 
in ihrer sequenziellen Abfolge analysierbar sind. Inhaltlich stütze ich mich bei 
meiner Analyse aufgrund fehlender systematischer Forschungen zu Emojis vor 
allem auf bisherige Untersuchungen zu den Funktionen von Emoticons, deren 
Ergebnisse im folgenden Kapitel kurz wiedergegeben werden. Anschließend 
skizziere ich die theoretischen Prämissen und methodologischen Prinzipien der 
Interaktionalen Stilistik (Kap. 3). Im Hauptkapitel 4 werden die empirische Stu- 
die und die daraus gewonnenen Funktionstypen vorgestellt und diskutiert. Ein 
kurzes Fazit beendet den Beitrag. 


3 Mit dieser Bezeichnung hebe ich darauf ab, dass Emojis reine Bildzeichen sind, die zudem 
nur marginal (bspw. Haut- oder Haarfarbe) modifizierbar sind. Im Unterschied dazu betrachte 
ich Emoticons als graphostilistische Elemente, da ein Emoticon „ein aus Tastenbelegungen 
zusammengesetztes, graphematisches Zeichen“ (Albert 2015: 11) darstellt, das verschiedene 
Kombinationsmöglichkeiten zulässt. 
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2 Funktionen von Emoticons — 
ein Abriss zur bisherigen Forschung 


Emoticons bzw. Smileys sind charakteristische Phänomene des Sprachge- 
brauchs in internetbasierter Kommunikation (vgl. Bieswanger 2013: 470). Ihr 
Aufkommen wird ganz allgemein mit der Schriftlichkeit internetbasierter Kom- 
munikation begründet, der es an para- und nonverbalen Ausdrucksmitteln 
mangelt, die durch Emoticons (und andere graphostilistische Mittel) in gewisser 
Weise ikonografisch abgebildet werden (können). 


Der Gebrauch der Smileys kann aufgrund seiner kommunikativen Funktionen als eine 
Kompensationsstrategie für den Gebrauch verbaler und non-verbaler Merkmale in der ge- 
sprochenen Sprache begriffen werden. Das, was im Gespräch Gesprächspartikeln und In- 
terjektionen, Prosodie, Mimik und Gestik funktional leisten, wird im Chat durch Smileys 
und andere Mittel ausgedrückt. (Runkehl et al. 1998: 99) 


Auf diese Weise dienen Emoticons in erster Linie dem Ausdruck von Emotionen 
bzw. Gefühlen (was der Bezeichnung gleichsam eingeschrieben ist) sowie der 
Kennzeichnung von Sprechereinstellungen (vgl. Runkehl et al. 1998: 98; Albert 
2015: 7-8).* Die mit einer solch eingeschränkten Sichtweise unterstellte Konzep- 
tualisierung der Emoticons als ikonische Zeichen greift jedoch zu kurz, gleich- 
wohl „die Form der Emoticons ursprünglich durch Ähnlichkeiten mit Gesichts- 
ausdrücken motiviert war, die ihrerseits konventionell mit verschiedenen 
Gefühlen in Verbindung gebracht werden“ (Albert 2015: 7; siehe dazu auch 
bereits Beißwenger 2000: 96-99). Neben den ikonischen Aspekten sind in der 
Analyse der konkreten Verwendung immer auch die indexikalischen Potenziale 
sowie die ‚Symbolhaftigkeit‘- als Mittel der Schriftkommunikation haben Emo- 
ticons einen Prozess der Konventionalisierung bzw. Symbolifizierung durchlau- 
fen — miteinzubeziehen (vgl. Imo 2015b: 155-157). Vor diesem Hintergrund sind 
Emoticons nicht in erster Linie als Ersatz für Multimodalität in der Face-to-Face- 
Kommunikation zu begreifen, sondern vielmehr „ähnlich zu interpretieren [...] 
wie verbale Einheiten und nicht wie gestische, mimische oder prosodische Phä- 
nomene“ (Imo 2015b: 137). Ähnlich argumentieren aus einer sprechakttheo- 
retischen Perspektive auch Dresner/Herring (2010: 250), „that in many typical 
cases, emoticons indicate the illocutionary force of the text to which they are 
attached, contributing to its pragmatic meaning, and are thus part and parcel of 


4 In einigen Untersuchungen wird zudem dafür plädiert, dass Emoticons als Interpunktions- 
zeichen fungieren können (vgl. Rinas/Uhrovä 2016; Albert 2015). 
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the linguistic communication channel“. Sie identifizieren vor allem drei Funkti- 
onen von Emoticons (Dresner/Herring 2010: 250): 


(a) as emotion indicators, mapped directly onto facial expression; 

(b) as indicators of nonemotional meanings, mapped conventionally onto facial expres- 
sions; and 

(c) as illocutionary force indicators that do not map conventionally onto a facial expres- 
sion. 


Fiir die hiesige Linguistik sind es insbesondere die im Rahmen des DFG- 
Netzwerks Empirikom entstandenen Untersuchungen von Beißwenger et al. 
(2012) und Imo (2015b), die einen differenzierteren Blick auf die Funktionen von 
Emoticons erlauben. Beißwenger et al. (2012) nähern sich Emoticons aus einer 
grammatischen Perspektive. Ziel ihres im Rahmen der Text Encoding Initiative 
(TEI) entwickelten Klassifikationsschemas ist die Annotation von Korpora in- 
ternetbasierter Kommunikation. In Anlehnung an Zifonun et al. (1997) klassifi- 
zieren sie Emoticons neben anderen Einheiten auf der Mikroebene von Postings 
als „Interaktive Einheiten“ bzw. interaction signs.° Als solche sind Emoticons 
„often used to portray facial expressions, and they typically serve as emotion, 
illocution, or irony markers“ (Beißwenger et al. 2012: 18), wobei sich die funkti- 
onale Beschreibung bzw. Erfassung im Vergleich zu einer Inventarisierung der 
unterschiedlichen Formen als deutlich schwieriger erweist. Prinzipiell wird 
unterschieden zwischen einer systemic function und einer context function von 
Emoticons. Bezugnehmend auf Löbners Unterscheidung von Ausdrucks- und 
Äußerungsbedeutung (Löbner 2003) ist die Annahme der AutorInnen, dass für 
häufig gebrauchte Emoticons in bestimmter Weise eine Art Grundbedeu- 
tung/Grundfunktion festgeschrieben ist (beispielsweise in diversen Listen im 
Netz, verwiesen wird im Text auf Wikipedias „List of emoticons“), diese Grund- 
funktion in gegebenen Kontexten aber in hohem Maße differieren kann. Diese 
Unterscheidung ist sicherlich nützlich, weil sie a) Ansatzpunkte für die Interpre- 
tation der Bedeutung resp. der Funktion von Emoticons liefert und b) zur (quan- 
titativen) Analyse bzw. Annotation der Daten genutzt werden kann. Eine Ant- 
wort auf die Frage, auf welche Weise man die kontextuelle Funktion ermittelt, 
bleiben die AutorInnen jedoch schuldig bzw. ist dies die Aufgabe qualitativer 


5 Ich verwende die Ausdrücke ‚Mikrostruktur‘ und ‚Makrostruktur‘ in WhatsApp-Interak- 
tionen in Anlehnung an Beißwenger et al. (2012), die unter der microstructure von Verläufen in 
Genres internetbasierter Kommunikation den Inhalt einzelner Nutzer-Postings und unter der 
macrostructure Sequenzen aus zwei oder mehreren Postings in ihrer spezifischen Anordnung 
und Struktur verstehen. 
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Analysen. Eine solche legt Imo (2015b) zum Emoticon :-) vor, wobei an dieser 
Stelle nur die Ergebnisse zu den „interaktionalen und textuellen Funktionen“ 
(Imo 2015b: 144) aufgelistet werden sollen. Auf sie wird unten in der Analyse 
zurückzukommen sein. 


Interaktionale und textuelle Funktionen des Emoticons :-) nach Imo: 


(i) 


Ausdruck von Freude tiber ein Ereignis darstellen 


(ii) Markieren von phatischer Kommunikation 

(iii) Kontextualisieren von scherzhafter Interaktionsmodalitat 
(iv) Face-work bei gesichtsbedrohenden Aktivitäten 

(v) Strukturieren von Äußerungen 


Die aufgrund des begrenzten Rahmens hier nur kurz skizzierten Analysen von 
Beißwenger et al. und Imo zeigen vor dem Hintergrund meines Untersuchungs- 
gegenstandes vor allem viererlei: 


a) 


b) 


c) 


d) 


Es handelt sich bei Emoticons zwar prinzipiell um ikonische Zeichen, deren 
Ähnlichkeit mit der entsprechenden Mimik auf eine Art Grundbedeutung 
hindeutet, diese wird jedoch in entsprechenden Kontexten oftmals von in- 
dexikalischen (Emoticons als „weiche“ Kontextualisierungshinweise) oder 
symbolischen Aspekten überlagert, d.h. dass einzelne Emoticons ein „inhä- 
rentes Bedeutungspotential haben, das teilweise konventionalisiert sein 
kann“ (Imo 2015b: 155); 

Selbst wenn man die „dominanteste und salienteste Funktion“ (Imo 2015b: 
144) für die Kategorisierung relevant setzt, bleiben Interferenzen mit ande- 
ren Funktionen bestehen, so dass Polyfunktionalität eher die Regel als die 
Ausnahme ist; 

Emoticons sind immer in umgebende Einheiten gebettet, die unterschiedli- 
che Ausdehnungen aufweisen können, im Minimalfall ist von einer zwei- 
gliedrigen Struktur auszugehen: „das Emoticon :-) und eine Vorgängeräu- 
Berung, auf das es sich bezieht“ (Imo 2015b: 158), im Maximalfall kann sich 
der Skopus über das gesamte Kommunikat erstrecken (vgl. Imo 2015b: 156); 
Um die kontextsensitiven Funktionen von Emojis adäquat beschreiben zu 
können, bedarf es einer strikt empirischen und qualitativ ausgerichteten 
Herangehensweise, die dem sequenziellen Charakter der kollaborativen 
Sinnerzeugung Rechnung trägt. 
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3 Theorie und Methode der Interaktionalen 
Stilistik 


In einigen der Untersuchungen zu Emoticons wird gleichsam am Rande und 
ohne diese Spur weiter zu verfolgen darauf verwiesen, dass Emoticons als gra- 
phostilistische Mittel (u.a. Runkehl et al. 1998: 64; Schlobinski et al. 2001: 11) 
dienen, die beispielsweise „den informellen Charakter einer Kommunikation“ 
(Döring 1999: 42) signalisieren. Ähnlich äußert sich auch Albert (2015: 8), der 
den Gebrauch des Emoticons statt eines Ausrufezeichens in der Äußerung freu 
mich schon so :-) nur stilistisch erklärt wissen möchte, nämlich insofern, als hier 
„Informalität und soziale Nähe“ signalisiert und somit die Äußerung kontextua- 
lisiert werde. Anknüpfend an die oben vorgestellte Arbeit von Beißwenger et al. 
(2012) verwendet Storrer (2013: 183) auf die interaktiven Einheiten bezugneh- 
mend an anderer Stelle für Emoticons die Kategorienbezeichnung „Stilmarker“. 
In einer Untersuchung zu den multimodalen Möglichkeiten in der WhatsApp- 
Kommunikation bezeichnet schließlich Arens (2014: 90) die dort verwendeten 
Emojis als „evaluierende Stilmittel“. Diese punktuellen Hinweise aufgreifend 
möchte ich im Folgenden dafür plädieren, die Verwendung von Emojis als eine 
Frage des Stils zu betrachten, d.h. die herauszuarbeitenden Funktionen der 
ikonostilistischen Ausdrucksmittel in ein stilistisches Gesamtkonzept einzubet- 
ten, und zwar in jenes der Interaktionalen Stilistik, die als „Teilkomponente 
einer interaktionalen Linguistik“ (Selting 2001: 17) aufgefasst werden kann.‘ 
Prinzipiell lässt sich Stil aus dieser Perspektive folgendermaßen definieren: 


Sprachlicher Stil ist die sozial relevante Art der Durchführung einer Handlung mittels Text 
oder interaktiv als Gespräch. Diese Art der Handlungsdurchführung wird durch Eigen- 
schaften des Textes oder des Gesprächs im Kontext ausgedrückt und ist bezogen auf 
Komponenten der Interaktion; in Bezug auf diese wird die Handlung mit stilistischem 
Sinn angereichert. (Sandig 1995: 28) 


Untersuchungsgegenstand der Interaktionalen Stilistik sind authentische, in 
der Regel informelle Gespräche, d.h. sie „legt besonderen Wert auf die empiri- 
sche und die Teilnehmerperspektiven rekonstruierende Analyse der Stilherstel- 
lung und Stilverwendung in natürlichen Interaktionskontexten“ (Selting 1997: 


6 Voraussetzung einer solchen theoretischen und methodologischen Orientierung ist freilich, 
dass man WhatsApp-Kommunikationen als Interaktionen anerkennt (vgl. Kap. 1 und die dort 
aufgeführte Literatur). 
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10). Dabei geht sie nach Selting (1995: 225-226, 1997: 10-11) von folgenden Prä- 

missen aus: 

1) Unter konversations- und kontextualisierungsanalytischer Perspektive ist 
Kommunikation zwischen Sprechern und Hörern bzw. Rezipienten kein je 
monologischer Austausch von Informationen, sondern Kommunikation ist 
ein wechselseitig hergestellter und aufeinander bezogener Interaktions- 
und Interpretationsprozeß zwischen Sprechern und Rezipienten (...). 

2) Sprachliches Handeln ist eine interaktive Leistung, an deren Herstellung 
und Aushandlung sowohl die Sprecher als auch die Rezipienten beteiligt 
sind (...). 

3) Interaktion ist sequentiell geordnet und wird von den Interaktionspartnern 
lokal und auf die jeweiligen Rezipienten zugeschnitten geregelt und ausge- 
handelt (...). 

4) Die interaktive Bedeutung konversationeller Aktivitäten ist jedoch nicht nur 
sequentiell bedingt, sondern der kontextspezifische Interaktions- und In- 
terpretationsprozeß wird auch durch Kontextualisierungshinweise gesteu- 
ert (...). 


An den Prämissen sieht man bereits mindestens zwei der von Linell (1998) pos- 
tulierten Prinzipien für interaktionale Kommunikation durchscheinen (Prinzip 
der Sequenzialität (3), Prinzip des kollaborativen Hervorbringens von Bedeu- 
tung und Struktur (1)). Das Prinzip der Kontextgebundenheit ist zu beziehen auf 
die im Laufe der Sozialisation ausgebildeten Normalformerwartungen „über die 
Erwartbarkeit bestimmter Stile in bestimmten Kommunikationskontexten“ (Sel- 
ting 2001: 5), so beispielsweise die Erwartung bestimmter kommunikativer Gat- 
tungen in bestimmten Interaktionssituationen (vgl. Imo in diesem Band). Das in 
der Perspektive der interaktionalen Stilistik wohl wichtigste Prinzip ist jedoch 
das der Reflexivität, denn in Abgrenzung zu anderen stilistischen Ansätzen wird 
Stil „nicht mehr als vom Kontext abhängige oder gar determinierte Variable 
aufgefaßt“, sondern es wird davon ausgegangen, „daß die Beziehung zwischen 
Stil bzw. Sprachverhalten und Kontext eine wechselseitige, reflexive und inter- 
dependente Beziehung ist“ (Selting 1997: 12). 


Stilherstellung und -veränderung ist dann allgemein ein Kontextualisierungsverfahren, 
eine Methode, die den Interaktionspartnern in natürlichen Gesprächen zur Verfügung 
steht, um Interpretationsrahmen nahezulegen und damit Kontexte, Aktivitätstypen, Teil- 
nehmerbeziehungen, Interaktionsmodalitäten usw. zu definieren, herzustellen und ggf. 
zu verändern. (Selting 1997: 11) 
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Die den Stil jeweils konstituierenden Stilmittel, die als Kontextualisierungshin- 
weise fungieren (Gumperz 1982, 1992), können verbaler, para- und nonverbaler 
Art sein (vgl. Fix 1996a, 2001). Rekonstruierbar wird der verwendete Stil dann 
„als Bündel kookkurrierend verwendeter konstitutiver Merkmale aus unter- 
schiedlichen sprachlichen und nicht-sprachlichen Systemen“ (Selting 2001: 9). 
Emojis als ikonostilistische Mittel sind somit neben anderen Merkmalen „als 
sozial und interaktiv relevante und signifikante Zeichen zu untersuchen“ (Sel- 
ting/Hinnenkamp 1989: 5), die zur Ausprägung einer ganzheitlichen Gestalt 
beitragen, die den jeweils gültigen Interpretationsrahmen nahelest.’ Die damit 
instanziierten Interpretationsrahmen erstrecken sich über jeweils spezifische 
Geltungsbereiche. So kann der mittels Emoji-Gebrauch relevant gesetzte Stil 
sequenziibergreifend für das gesamte Kommunikat Gültigkeit erlangen, und 
somit als ganzheitliche Gestalt (Fix 1996b) erscheinen, vorausgesetzt freilich, er 
wird von den Teilnehmenden ratifiziert. Andererseits können aber auch einzel- 
ne Emoijis bzw. Emojikombinationen als „Kontextualisierungsschlüssel [her- 
vortreten], die das Gesagte [jeweils] auf den kontextuellen Rahmen beziehen, im 
Hinblick auf den es zu interpretieren ist“ (Gumperz 1994: 630). Bezogen auf 
meinen Untersuchungsgegenstand heißt das, dass Emojis einerseits ganz gene- 
rell dazu beitragen (können), den Stil einer WhatsApp-Interaktion als „unge- 
zwungen“ zu markieren (Makroebene). Andererseits erfüllen sie Funktionen auf 
der Mikroebene, indem sie einzelne Aktivitätsteile kontextualisieren und mithin 
interpretierbar machen (vgl. Sandig 1997: 11). 

Die methodische Grundausrichtung der interaktionalen Stilistik formuliert 
Selting (2008: 1044) folgendermaßen: 


Interactional stylistic analysis is a strictly empirical method, based on data from natural 
interaction that is recorded (audio or video) and conserved for repeated inspection. The 
goal of interactional stylistic analysis in particular is the deconstruction of holistically in- 
terpreted styles in interaction, i. e. their decomposition into the smallest stylistically rele- 
vant cues and devices, and the reconstruction of their principles of use and interpretation 
in interaction. 


7 Aufgrund ihres häufigen Gebrauchs in der internetbasierten Kommunikation sind Emojis 
darüber hinaus evtl. sogar als prototypische Merkmale digitaler Interaktionen aufzufassen. Ob 
und in welchem Maße und für welche Gattungen dies in der WhatsApp-Kommunikation zu- 
trifft, ist eine quantitativ-empirisch zu beantwortende Frage. 
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Darüber hinaus werden von Selting (1997: 14, 2001: 15-16, 2008: 1044) einzelne 
Analyseschritte und -verfahren benannt, die abschließend zumindest erwähnt 
werden sollen (vgl. auch Imo (in diesem Band) zum methodischen Vorgehen der 
Interaktionalen Linguistik): 


Materialsuche und Hypothesenbildung: 

Identifikation und erste Charakterisierung der in einem Gesprächsausschnitt hergestellten 
holistischen Stile und deren intuitiv interpretierter Bedeutung durch die Analysieren- 
den;(...); 


Strukturanalyse: 

Dekomponierung bzw. Destrukturierung der holistischen Stile, möglichst bis in ihre 
kleinsten stil-konstitutiven Merkmale (...); Analyse der Kombinationsmöglichkeiten und 
-beschränkungen der Stilmittel zu stilherstellenden Merkmalsbündeln und -verfahren; 


Funktionsanalyse: 

Rekonstruktion der mit Hilfe der verwendeten Stile nahegelegten Interpretationsrahmen 
und Inferenzen sowie ihrer Funktionen in der Interaktion, v.a. im Hinblick auf Konstituti- 
on und Veränderung der Situationsdefinition, Aktivitätsherstellung, Selbstdarstellung, 
Beziehungsherstellung, usw.; 


Validierung und Rechtfertigung der Analyse: 

Nachweis der interaktiven Relevanz der Stilverwendung, d.h. Nachweis, daß sich die In- 
teraktionsteilnehmer in ihren Folgeäußerungen an der Stilverwendung bzw. Stilverände- 
rung orientieren und ihr weiteres Verhalten daran ausrichten. (Selting 2001: 15-16) 


Der Prozess des Suchens, Identifizierens, Charakterisierens und Dekomponie- 
rens der rekurrenten (Aushandlungs-)Muster zur Stilherstellung mittels der 
Verwendung von Emojis kann hier aber im Einzelnen nicht dargelegt werden. 
Auch nur am Rande erwähnt werden die in Kookkurrenz verwendeten Stilele- 
mente, da sie ausnahmslos die Interaktionen, Sequenzen und Aktivitäten als 
konzeptionell mündlich, d.h. als Nähe-Kommunikation kontextualisieren (zu 
den Merkmalen konzeptioneller Mündlichkeit in schriftlicher internetbasierter 
Kommunikation vgl. u.a. Androutsopoulos 2007; Beißwenger 2000, 2016b). 
Vielmehr werden im Folgenden die auf der Basis der Daten herausgearbeiteten 
Emoji-Funktionstypen unter besonderer Berücksichtigung der interaktiven 
Relevanz ihrer Verwendung anhand ausgewählter Beispiele illustriert und ana- 
lysiert. 
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4 Kommunikative Funktionen von Emojis - 
Versuch einer Typologie 


Zu den kommunikativen Funktionen von Emojis gibt es bislang nur wenige 
Untersuchungen. Die Arbeiten, die sich mit dem Emoji-Gebrauch beschäftigen, 
thematisieren ihn in der Regel als ein Merkmal digitalen Schreibens, wobei die 
Funktionen meist im Zusammenhang mit den multimodalen Potenzialen von 
WhatsApp oder anderen Diensten lediglich kurz angerissen werden (Dürscheid 
2016; Dürscheid/Frick 2014; Arens 2014; Imo i.V.). Die Ergebnisse sind vor die- 
sem Hintergrund eher allgemeiner Art. So wird beispielsweise dargelegt, dass 
die „Kommentarfunktion“ die „am weitesten verbreitete und bekannteste Funk- 
tion“ (Dürscheid/Frick 2016: 105; vgl. Dürscheid/Frick 2014: 173) sei, ohne dies 
empirisch belegen zu können. Daneben wird an jeweils einzelnen Beispielen 
gezeigt, dass Emojis „der Illustration der Äußerung dienen“ oder zur Realisie- 
rung der „sogenannten Darstellungsfunktion“ verwendet werden (Dür- 
scheid/Frick 2016: 105; vgl. Dürscheid et al. 2010: 95). Hinz (2015) widmet sich 
zwar dezidiert den Funktionen von „Emoticons and Pictograms“, bezieht sich 
aber im Wesentlichen auf die allgemeinen Funktionsbestimmungen von Dür- 
scheid/Frick (2014) sowie Dresner/Herring (2010). Auch Siebenhaar (i.Dr.) ori- 
entiert sich weitgehend an diesen Untersuchungen. Ausgehend von den von 
Dürscheid/Frick (2014) aufgezeigten Funktionen erweitert er diese korpusba- 
siert, indem er Beispiele für Fälle vorstellt, in denen Emojis „als Ersatz für kom- 
plexe Propositionen“ oder als „Ersatz ganzer Kommunikationshandlungen“ 
fungieren. Siever (2015: 281-303) präsentiert in ihrer Monografie eine ausführli- 
che Beschreibung zur „ikonographetischen Kommunikation“ und gibt so zu- 
mindest differenzierte Einblicke in die Darstellungsfunktion. Eher empirische 
Zugänge liefern zwei neuere Untersuchungen aus dem englischsprachigen 
Raum.’ So legen Herring/Dainas (2017) eine an die computer-mediated discourse 
analysis angelehnte Studie vor, in der sie auf der Basis eines Korpus aus Face- 
book-Kommentaren die Frequenz und die pragmatischen Funktionen von Emo- 
jis herausarbeiten. Mit dem dezidierten Verweis darauf, dass einige der Ver- 
wendungsweisen mehrdeutig seien und es darüber hinaus offenbar „a few other 
uses" (Herring/Dainas 2017; Hervorhebung i.Orig.) gäbe, postulieren die Auto- 


8 Auf die empirische Studie von Miller et al. (2016) zur Rezeption und Interpretation von 
Emojis und den möglichen Gründen für Missverständnisse sei an dieser Stelle nur hingewie- 
sen. 


Zu kommunikativen Funktionen von Emojis in der WhatsApp-Kommunikation —— 187 


rinnen für die von ihnen als graphicons bezeichneten Emojis die folgenden 

Funktionen: 

— mention (vs. use): metakommunikative Funktion; 

— reaction: (emotionale) Rückmeldung auf vorherigen Inhalt; 

— riff: humorvolles Spiel/Parodie in Bezug auf vorgängige verbale und non- 
verbale Kommentare; 

— tone modification: Modalisierung des vorangehenden Textes; 

— action: Darstellung einer typischen physischen Handlung; 

— narrative sequence: visuelles Erzählen/Darstellen. 


An die Ergebnisse der aufgeführten Untersuchungen wird neben den oben dar- 
gelegten Erkenntnissen zu den Funktionen von Emoticons in der nun folgenden 
Analyse angeknüpft, insofern sich Parallelen im Untersuchungsmaterial finden 
lassen. 


4.1 Datengrundlage 


Bei der hier vorgestellten Untersuchung handelt es sich um eine explorative, 
qualitative Studie, die dem Tatbestand Rechnung trägt, dass bislang keine sys- 
tematischen Untersuchungen zu pragmatischen Funktionen von Emojis in der 
WhatsApp-Kommunikation vorliegen. In Bezug auf die Datenlage lässt sich 
Ähnliches konstatieren. Im Moment (Juni 2017) gibt es keine Korpora oder Da- 
tenbanken zur WhatsApp-Kommunikation bzw. sind diese noch nicht verfüg- 
bar, so wie jenes, im Rahmen des Forschungsprojektes „What's up, Switzer- 
land?“ entstandene Korpus, das „für Forschende ausserhalb des Projektes erst 
zum Projektende (Januar 2019) zur Verfügung stehen“ (http://www.whatsup- 
switzerland.ch/index.php/de/korpus) wird. Auch die Mobile Communication 
Database (MoCoDa) (Imo i.V., in diesem Band) befindet sich hinsichtlich der 
Sammlung von WhatsApp-Daten erst im Anfangsstadium.’ Die Analysen im 
vorliegenden Beitrag stützen sich auf zwei Datensets: 
1) Auf 65 Interaktionsausschnitte (bestehend aus ca. 1970 Einzelpostings) 
unterschiedlichen Zuschnitts aus einem zu Explorationszwecken zusam- 


9 Insgesamt gibt es momentan nur sehr wenige frei zugängliche Datensammlungen und 
Korpora zur Sprache in der internetbasierten Kommunikation. Die unzureichende Abdeckung 
des Gegenstandsbereichs in Korpora dürfte sich aber mittelfristig ändern, da gegenwärtig 
verschiedene Projekte auf dem Weg sind, diese Situation - für unterschiedliche Sprachen und 
Genres — zu ändern (Beißwenger et al. 2017, FiSer/Beißwenger 2016). 
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mengestellten Datenset mit WhatsApp-Interaktionen, das im Zeitraum 
2015-2017 von Michael Beißwenger an den Universitäten Dortmund und 
Duisburg-Essen erhoben wurde. Die enthaltenen Interaktionsausschnitte 
sind mit kontextuellen und bisweilen ethnografischen Informationen ge- 
rahmt und wurden von den Spenderinnen und Spendern pseudonymisiert 
(= Datenset WA-1). 

2) Auf eine private Sammlung von ca. 160 kurzen Interaktionsausschnitten, 
die in Form von Screenshots dokumentiert sind und die von Spenderinnen 
und Spendern bereitgestellt wurden. Der Vorteil dieser Sammlung liegt vor 
allem darin, dass in vielen Fällen nicht nur kontextuelle und ethnografische 
Angaben verfügbar sind, sondern darüber hinaus die Möglichkeit von Be- 
fragungen der InteraktionsteilnehmerInnen besteht. Das auf dieser Basis 
entstandene Datenset entspricht daher in hohem Maße dem der Studie zu- 
srundeliegenden qualitativen Forschungsdesign. Es enthält - ganz im Sin- 
ne der Interaktionalen Stilistik - authentische Interaktionen informell- 
privater Art, die hinsichtlich des hier verfolgten Untersuchungsziels in den 
oben dargelegten Schritten (Kap. 3) analysiert wurden (= Datenset WA-2).'° 


4.2 Analyse 


Um es in den Worten Austins (1979: 168) auszudrücken: Ich werde nun eine 
„vorläufige Klassifikation versuchen und einige Anmerkungen zu den vorge- 
schlagenen Einteilungen machen“. Vorläufig vor allem deshalb, weil weitere 
Untersuchungen an größeren Korpora notwendig sind, um die Ergebnisse zu 
validieren resp. zu modifizieren. Vorläufig aber auch, weil mir einige Kategorien 
insofern Schwierigkeiten bereiten, als sie sich nicht trennscharf von den ande- 
ren abgrenzen lassen. Ich werde dies an den entsprechenden Stellen problema- 
tisieren. Dennoch ist es meiner Ansicht nach möglich und sinnvoll, dominie- 
rende Funktionstypen zu identifizieren und zu benennen. Insgesamt 
kristallisierten sich nach Analyse der Daten neun Kategorien heraus: 

(i) Rahmung 

(ii) Okonomisierung 

(iii) Beziehungsgestaltung 

(iv) Modalisierung 


10 Die zur Verfügung stehenden Interaktionen sind in keinster Weise elizitiert, d.h. sie exis- 
tierten bereits vor der Anfrage des Verfassers, so dass Inszenierungen oder sonstige Manipulie- 
rungen ausgeschlossen werden können. 
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(v) Kommentierung/Evaluierung 
(vi) Strukturierung 

(vii) Darstellung 

(viii) Ludische Funktion 

(ix) Ausschmückung 


4.2.1 Funktionstyp i: Rahmung 


20. MÄRZ 2017 


Komme zu spät! Die Strecke ist vor 
Köln ist gesperrt ... ein 
Suizidgefährdeter. Das heißt, den 
pünktlichen Anschluss bekomme ich 
nicht. Evtl kannst du mich 
entschuldigen.. 


Mach ich. @ „... 


Merci (3 


Hups ... ich meinte den (seh ich 
gerade) &9) 


(Also @3=@) 


Oh Mann ... geht ja gut los ;-) 


Nicht schlimm & 


« 


Abb. 1: Rahmung (Datenset WA-2) 


Infolge der ‚Endlosdialoge‘ (vgl. Kap. 1) entfallen in der WhatsApp- 
Kommunikation in der Regel die beziehungssensitiven Formen der Anrede (vgl. 
Holly 2001: 1389), mit denen Interaktionen beispielsweise als privat-informell 
gerahmt werden (vgl. Androutsopoulos/Schmidt 2002: 57-58). Emojis kompen- 
sieren die fehlende Rahmung insofern, als sie der Interaktionssituation einen 
informellen Charakter einschreiben und im Zuge dessen ein Beziehungsangebot 
unterbreiten (vgl. Döring 1999: 42). So auch in Abbildung 1. Am Beginn der 
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wiedergegebenen Interaktion informiert A B darüber," dass es zu Verzögerun- 
gen im Bahnverkehr gekommen sei, weswegen sich A verspäte und B deshalb 
bittet, dies zu entschuldigen. Die darauf folgende Bestätigung schließt B mit 
einem Emoji eines winkenden Mannes ab und definiert damit den Rahmen der 
Folgeinteraktion (vgl. Selting 2001: 7). Mit dem Emoji indexikalisiert er die In- 
teraktion als „locker“ und/oder „umgangssprachlich“ bzw. als Nähe- 
Kommunikation (Koch/Oesterreicher 1985, 2008), und zwar als eine, die „nicht 
nur eine bereits vor der aktuellen Sprechsituation gegebene, vorausgesetzte 
Nähe reflektiert, sondern diese Nähe eben aktiv herstellt bzw. erzielt“ (Androu- 
tsopoulos 2007: 80). Der durch das stil-konstitutive Signal gesetzte Nähe- 
Rahmen eröffnet dem Gegenüber Anschlussoptionen, bisweilen sogar „Schab- 
lonen für eigene Äußerungen“ (Imo 2013: 42), die dieser annehmen oder ableh- 
nen kann. Die Rahmensetzung erfolgt jeweils kontextabhängig und unter Be- 
zugnahme auf das Wissen und die Erwartungen des Interaktionspartners 
(Kontextgebundenheit). Es handelt sich hier um eine Form von recipient design 
(vgl. Sacks et al. 1974: 727), mit der B auch die (von ihm gewünschte bzw. unter- 
stellte) soziale Beziehung zum Interaktionspartner multimodal markiert (vgl. 
Brown/Levinson 1987). Wie man sieht, handelt es sich in diesem Fall um eine 
Annahme des Angebots. Durch den Emoji-Gebrauch signalisiert A Zustimmung 
zur Informalisierung. Was wir sehen, ist eine wechselseitige/gemeinsame Sinn- 
konstitution durch Bildzeichen. Der interaktionale Charakter wird zusätzlich 
unterstrichen durch die Verwendung interaktiver Verfahren, wie wir sie aus 
Face-to-Face-Gesprächen kennen. In den Beiträgen vier und fünf vollzieht A 
eine selbstinitiierte Selbstreparatur (vgl. Schegloff et al. 1977), mit der sie nun - 
bezeichnenderweise aufgrund des Gebrauchs des „falschen“ Emojis — den Grad 
der Vertrautheit genauer definiert, die offenbar nicht so eng eingeschätzt wird, 
als dass ein Kuss-Emoji verwendet werden sollte. B signalisiert im Anschluss an 
As korrektive Schritte Entgegenkommen und bagatellisiert das Malheur, wiede- 
rum unter Verwendung eines „passenden“ Emojis, was von A im nächsten Bei- 
trag mittels zweier Emojis bestätigt wird. Interessant an dieser Selbstreparatur 
ist zum einen der zeitliche Verzug des Handelns und zum anderen, dass Emojis 
mit Emojis repariert werden können. Letzteres ist ein Indiz für die Ökonomisie- 
rungsfunktion (ii), die im Folgenden behandelt wird. Ersteres zeigt, dass die 
flächige Sprechblasen-Anordnung auf dem Smartphone-Bildschirm nicht nur 
nachträgliche Korrekturen erlaubt, sondern infolge der abgebildeten, und somit 
rekonstruierbaren Sequenz-Abfolge die Option zur selbstinitiierten Selbstrepa- 


11 Mit A wird hier wie auch in den anderen Beispielen immer der/die Interagierende benannt, 
der/die den initialen Beitrag liefert. 
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ratur eröffnet (vgl. Androutsopoulos 2007: 75-76). Zu den oben angesprochenen 
Interferenzen ist anzumerken, dass es sich hier natürlich um eine Art der Bezie- 
hungsgestaltung handelt, die durch den Emoji-Gebrauch als vertraut gerahmt 
wird (Funktion iii), aber eben nur als vertraut und nicht als intim, was aufgrund 
des offensichtlichen Lapsus von A eine gleichsam metakommunikative Bearbei- 
tung nach sich zieht. Dass diese mit der wechselseitigen Verwendung von Emo- 
jis einhergeht, zeigt zum einen die Interaktivität (Reflexibilität, Sequenzialistät, 
Kollaborativität) und zum anderen, dass hier eine Form multimodaler „Ak- 
komodation bei der Verarbeitung eines Missverständnisses“ (Schmidt/ 
Androutsopoulos 2004: 66) vorliegt. 


4.2.2 Funktionstyp ii: Ökonomisierung 


Fahre hier in 15 Min.los! 


ei 


Abb. 2: Ökonomisierung (Datenset WA-2) 


In der alleinstehenden Sequenz in Abbildung 2 (davor bzw. danach sind längere 
Pausen) kündigt A an, in 15 Minuten loszufahren. Offenbar möchte B vor der 
Abfahrt von A mit A telefonieren. Um dies zu signalisieren, verwendet er das 
entsprechende Telefonhörer-Emoji. B bestätigt den Wunsch/die Bitte durch das 
reaktive Daumenzeichen. Die vier Beiträge werden innerhalb einer Minute pro- 
duziert, was auf einen hohen Interaktivitätsgrad hindeutet (vgl. König 2015: 
101), der aufgrund der damit verbundenen Erwartungen zügiges Handeln erfor- 
dert. Realisiert wird dieses hier durch das Verwenden von Emojis, die keiner 
Formulierungsarbeit bedürfen und somit (zumindest potenziell) eine quasi- 
synchrone Kommunikation unterstützen,” indem sie verbale Praktiken ersetzen 


12 Der mittels Emoji-Gebrauch erhöhte Interaktivitätsgrad zeigt, dass Interaktivität und (Qua- 
si-)Synchronitat nicht ausschließlich auf die technischen Rahmenbedingungen bezogen wer- 
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und somit zu einer „Verdichtung dialogischer Strukturen“ (Androutsopoulos 
2007: 78) beitragen. Auch an diesem Beispiel sind die Funktionen der Emojis 
mehrdeutig. So könnte man die Verwendung des Telefonhörers auch dem Dar- 
stellen (vii) und den Daumen dem Kommentieren/Evaluieren (v) zuordnen, 
denn durch seinen Gebrauch wird sequenziell Zustimmung angezeigt. Unbese- 
hen davon dienen die Bildgebräuche aber eben auch der Ökonomisierung, weil 
sie auf einfachem Wege prompte Reaktionen ermöglichen, was mit diesem Bei- 
spiel verdeutlicht werden sollte. 


4.2.3 Funktionstyp iii: Beziehungsgestaltung 


Regen in Duisburg. ... e963 6363 


Mmmhhh. (3 


Abb. 3: Beziehungsgestaltung 1 (Datenset WA-2) 


Im präsentierten Auszug (Abb. 3) geht es in erster Linie darum, dass A B mitteilt, 
dass es in Duisburg regnet, was von A offenbar moniert wird, worauf das erste 
Bildzeichen hindeutet, das an dieser Stelle die Kommentar-/Evaluierungs- 
funktion (v) erfüllt. Im Gegensatz dazu wird mit den folgenden drei Kuss-Emojis 
kein Bezug zum Inhalt der Äußerung hergestellt. Hierbei geht es ausschließlich 
um das Anzeigen von Gefühlen, einer Funktion, auf die v.a. in der Forschung zu 
Emoticons immer wieder hingewiesen wurde (u.a. Beißwenger et al. 2012; Dres- 
ner/Herring 2010; Runkehl et al. 1998). Emojis fungieren in diesem Zusammen- 
hang als beziehungssensitive ikonische Ausdrucksformen und dienen so in 
erster Linie dem Beziehungsmanagement (vgl. Holly 2001: 1389-1390).” Inhalts- 


den sollten, sondern als „dynamische Zeitrelationen“ begriffen werden müssen, „die von den 
Beteiligten unter Beachtung der jeweiligen Technologie gemeinsam hergestellt werden“ 
(Androutsopoulos 2007: 89). 

13 Holly (2001: 1389) weist im Zusammenhang seiner Klassifikation von „sprachlichen Aus- 
drucksformen“, die als „besonders beziehungssensitiv gelten können“ darauf hin, dass „man 
die nicht-sprachlichen Mittel niemals aus dem Blick verlieren sollte“. Das gilt umso mehr für 
eine Reihe von Emojis, die offenbar genau zu diesem Zweck entworfen und im Unicode-System 
implementiert wurden. 
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und Beziehungsebene werden im vorliegenden Beispiel offenbar voneinander 
getrennt, wobei die Kuss-Emojis einer Art phatischer Kommunikation zuzu- 
rechnen wären, mit der sich die Interagierenden gegenseitig und unmissver- 
ständlich soziale Nähe signalisieren (vgl. Imo 2015b: 146). In den meisten Fällen 
ist der Gebrauch der Emojis in dieser Funktion mit Wünschen, Grüßen etc. ver- 
bunden (vgl. Abbildung 4), was hier wohl weniger zutrifft. Was man aber sehr 
gut sieht, ist, dass B das vorgegebene Muster wiederaufnimmt, indem er seine 
Äußerung analog strukturiert. Der „Hörerkommentar“ „mmmhhh“ bezieht sich 
eindeutig auf die Sachinformation inklusive der durch das erste Emoji mitgelie- 
ferten Evaluation von A, der Gebrauch des Kuss-Emojis hingegen auf die selbi- 
gen von A. 


6.11.2015, 18:38 Thomas60: Hallo meine Lieben. Wir sind gut in Paderborn 
angekommen und machen uns heute einen 
gemitlichen Abend. Morgen Vormittag Sightseeing und 
abends lecker Essen (euer Geschenk...). Wir freuen 


uns sehr! Haben euch sehr lieb! Y V Y iS cS S 
DA Bd BC 
ry UY of Papa und Anja 

6.11.2015, 19:03 Marisa25: Das freut mich VYY Wünsche euch ganz viel 


Spaß 
6.11.2015, 19:03 Marisa25: Ich bin auch gut in Bremen angekommen 


6.11.2015, 19:04 Marisa25: Machen uns heute einen gemütlichen Abend ® © 
9 9 @ 
6.11.2015, 19:04 Marisa25: Bis spätestens Montag 9 VY Y 


6.11.2015, 19:06 Thomas60: Ja, viel Spaß! Macht es euch schön. Hdgdl. ‘> Papa. 
Bis Montag 


6.11.2015,19:06  Marisa25: Ich dich auch ® @ 


Abb. 4: Beziehungsgestaltung 2 (Datenset WA-1) 


Bei der Sichtung der Daten sind einige Emoji-Gebrauchsweisen aufgefallen, 
deren Interpretation sich als äußerst schwierig erwies bzw. Raum zu vielfältigen 
Spekulationen eröffnete. Es handelt sich dabei um Emojis bzw. Emoji- 
Kombinationen, die kontextunabhängig in der gleichen oder einer leicht variier- 
ten Form regelmäßig verwendet wurden. Da dem Verfasser die Datenspender- 
Innen bekannt sind, wurde in diesem Fall die Möglichkeit genutzt, die Intera- 
gierenden direkt auf diese doch recht kryptischen Formen anzusprechen. Es 
stellte sich bei allen Befragten heraus, dass es sich dabei um (geheime) Symbole 
handelt, die engste Vertrautheit und Nähe zum Ausdruck bringen, sozusagen 
intime In-group-Marker, die der gegenseitigen Sympathiebeteuerung dienen 
(vgl. Brown/Levinson 1987). Die auf Verabredung beruhenden, und somit kon- 
ventionellen Zeichen sind mehr oder weniger Zufallsprodukte, die dann gleich- 
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sam emblematisch als Ausdruck für die Beziehung verwendet werden und 
durch steten Gebrauch zu beziehungssensitiven rituellen Formeln (vgl. Holly 
2001: 1389) geronnen sind, die in der Regel wechselweise in Paarsequenzen 
ausgetauscht werden. 


20. APRIL 2017 


DO we 


Fahre jetzt los bh 


09:43 


Oot 09:54 7 


LA 
o> 


09:55 


Abb. 5: Beziehungsgestaltung 3 (Datenset WA-2) 


Viel SpaB morgen in 


p Hildesheima <> & @ 


Abb. 6: Beziehungsgestaltung 3 (Datenset WA-2) 


In beiden Fällen haben wir es mit einer besonderen Ausprägung der Bezie- 
hungsgestaltung zu tun. Im Gegensatz zu der oben beschriebenen wird die 
Funktion hier nicht explizit angezeigt, sondern vielmehr verschlüsselt, so dass 
eine Art exklusiv hermetische Kommunikation (Fix 1995) vorliegt, die die Wis- 
senden zusammenschweißt, Andere hingegen ausschließt, d.h. ohne die Erläu- 
terungen der InformantInnen wäre eine Decodierung schlichtweg nicht mög- 
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lich. Freilich gibt es auch hier Abstufungen, wie an den Beispielen zu sehen ist. 
So könnte man vermuten, dass zwei Ringe (Abb. 5) in Analogie zu den Hoch- 
zeitsringen irgendetwas mit der Beziehung zu tun haben könnten.“ Aber was 
bedeutet der Anker? Das Paar, von dem die Interaktion in Abbildung 5 stammt, 
erklärte dem Verfasser, dass beide Symbole als Zeichen für ihre Liebe stünden, 
warum es aber gerade der Anker ist, wisse man nicht mehr so genau. Es habe 
vielleicht etwas mit „im Hafen angekommen“ zu tun. Im Beispiel in Abbildung 6 
sehen wir eine Kombination aus einem Bild einer Schildkröte, dem Symbol für 
eine stiebende Bewegung und den „grinsenden Kackhaufen“ plus jeweils ein 
weiteres Emoji. Die hier kommunizierenden Spenderinnen (es handelt sich um 
zwei Freundinnen) konnten den genauen Anlass bzw. die Motivation für diese 
Kombination nicht mehr erinnern, behaupteten aber (was in den Daten nach- 
weisbar ist), dass die ersten drei Symbole obligatorisch, das vierte hingegen 
fakultativ sei und jeweils kontextabhängig ergänzt werde. Die beiden Beispiele 
zeigen, inwiefern der „Anspielungsreichtum der intim-vertrauten Kommunika- 
tion“ (Schmidt/Androutsopoulos 2004: 68) auch auf bildlicher Ebene realisiert 
werden kann. 


4.2.4 Funktionstyp iv: Modalisierung 


25. SEPTEMBER 2016 
Bist Du beim Marathon mitgelaufen. 
Da war einer, der sah aus wie Du. 
16:58 W 
Mhyo. Ich bin voll im Arsch. 12:35 
Komisch. Doppelganger? 12.12. 


Möglich. 1:3x 


Dutzendgesicht KÈ ayy y 
Radiogesicht 14:4x S 


Abb. 7: Modalisierung (Datenset WA-2) 


14 Darauf verweist in vielen Fällen auch die Einbettung in Sequenzen, in denen es explizit um 
die wechselseitige Bestätigung der Liebesbeziehung geht, was analog auch für das Anker- 
Emoji gilt. 
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Mit Hilfe von Emojis können bestimmte Interpretationen und Bewertungen von 
verschiedenen Aktivitäten nahegelegt werden. Emojis fungieren dabei als Kon- 
textualisierungsschlüssel (Gumperz 1982) für verschiedene Interaktionsmodali- 
täten, d.h. sie dienen dem Modalisieren (vgl. Schwitalla 2012: 168-170). Imo 
(2015b: 148-150) hat für das Emoticon :-) herausgearbeitet, dass es vorrangig im 
Zusammenhang mit Aktivitäten genutzt wird, „bei denen die Markierung der 
Interaktionsmodalität als scherzhaft für die Interagierenden notwendig ist“ 
(Imo 2015b), wie beispielweise beim Frotzeln, bei hyperbolischen Aussagen 
oder zur Abfederung gesichtsbedrohender Aussagen, die wir auch in Abbildung 
7 sehen. Der Kontext ist aus dem abgebildeten Verlauf problemlos erschließbar. 
Durch die Verwendung des Tränen-Lach-Emojis signalisiert A, dass er die doch 
recht despektierliche Behauptung, B hätte ein Dutzendgesicht, als Scherz aufge- 
fasst wissen möchte, was B dazu animiert, mit einer nicht minder scherzhaften 
Replik darauf zu reagieren - ein weiterer Beleg für die Reflexivität und das kol- 
laborative Aushandeln von Sinn. 


4.2.5 Funktionstyp v: Kommentierung/Evaluierung 


Bei dieser Funktion handelt es sich um die Kommentierung, Bewertung oder 
emotionale Einordnung eines Sachverhalts oder einer Handlung (vgl. Dür- 
scheid/Frick 2016: 105). Bezug genommen wird dabei sowohl auf eigene als 
auch auf fremde Äußerungen/Handlungen, die in der Regel vor dem kommen- 
tierenden Emoji erscheinen (vgl. Abb. 2 für den Fremdbezug). In dieser Funkti- 
on sind Emojis vielleicht am deutlichsten als bildliche Simulation von Gestik, 
Mimik oder Prosodie aufzufassen, wobei es sich aber immer noch um die be- 
wusste und punktuelle Setzung solcher Kontextualisierungshinweise handelt 
und sie deshalb von den redebegleitenden mimischen, gestischen und proxemi- 
schen Handlungen in der mündlichen Kommunikation unterschieden werden 
müssen. Zudem wirken die Bildzeichen „als singulärer ‚Schnappschuss‘ (...) 
sehr viel salienter“ (Imo 2015b: 136) als die multimodalen „Vorlagen“ aus der 
Face-to-Face-Kommunikation. Gleichwohl lassen sich bestimmte Parallelen 
zum multimodalen Zeichenrepertoire mündlicher Kommunikation aufzeigen. So 
werden hier wie da Zeichen genutzt, die konventionell mit verschiedenen Ein- 
stellungen und/oder Gefühlen verknüpft werden (beispielsweise der hochge- 
reckte Daumen, vgl. Abb. 2). Und hier wie da können sie verbale Kommenta- 
re/Bewertungen ersetzen (vgl. Fricke 2012), so dass für den Daumen die 
Formulierungen „Das ist prima.“ oder „Geht klar.“ (vgl. Abb. 2) möglich wären. 
Welche Zeichen letztlich genutzt werden, ist eine Frage der Wahl, und somit 
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eine Frage des kontext- und adressatenbezogenen Stils. Das Beispiel in Abbil- 
dung 8 ist insofern doch recht außergewöhnlich, als hier eine Art Emotionali- 
tätskaskade produziert wird, und zwar nahezu ausschließlich durch den Ge- 
brauch von Emojis. Grund dafür ist der nicht erscheinende Handwerker. 


Der Knilch war noch nicht hierQ9 
a ee ae I 
Knilch der. Bei der 
Wohnungsverwaltung ist auch keiner 
da. Frechheit. 16:09 W 


| ev 
16:10 


Immer noch nix! bow giq 


eo 16:20 


16 Uhr!!! 16:20 
Affe 16:21 w 
Voll! $, vor 


Immer noch kein Heizungsmensch 
y 


hier! @@ TA 
Ţv 


So ein Mist. 16:353 


Abb. 8: Kommentierung/Evaluierung (Datenset WA-2) 


Wie wir sehen, wird die emotionale Bewertung mittels Emoji-Variation sukzes- 
sive gesteigert. Dabei handelt es sich um eine Art höchst ökonomischer narrati- 
ver Themenentfaltung (vgl. Brinker et al. 2014)” über mehrere Nachrichten hin- 
weg, die die Komplikation entsprechend zuspitzt. Unterbrochen wird dies durch 
den Einwurf „Affe“ von B, den A unter Verwendung der bildlichen Wiederauf- 
nahme der vorgeschlagenen Kategorisierung mit dem Ausdruck „Voll!“ intensi- 


15 Die von Herring/Dainas (2017) postulierte Funktion narrative sequence käme an dieser 
Stelle wohl eher nicht in Betracht, da sie aus meiner Sicht der Darstellungsfunktion (Dür- 
scheid/Frick 2016: 105) zugerechnet werden sollte, die unten erläutert wird. 
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viert, so dass an dieser Stelle eine „gleichlaufende eskalierte Bewertungl[en]“ 
vorliegt (Auer/Uhmann 1982: 5-6). Darüber hinaus fungiert das Affen-Emoji 
hier ganz offensichtlich als bildliche Anapher (vgl. 4.2.7). Die abschließende 
Verdopplung des Emojis (im Zusammenspiel mit den drei Ausrufezeichen) im 
letzten Beitrag visualisiert die offenbar immer noch steigerungsfähige Wut von 
A. 


4.2.6 Funktionstyp vi: Strukturierung 


Bei der folgenden Funktion „treten stärker sequenz-, diskurs- und informations- 
strukturierende Aspekte in den Vordergrund“ (Imo 2015b: 152). Gleichwohl 
wohnt ihr pragmatisches Potenzial inne, da die damit realisierte Segmentierung 
von Äußerungen/Aktivitätstypen immer auch mit anderen Funktionen verbun- 
den ist, vor allem mit den bereits beschriebenen. D.h. Emojis werden in diesem 
Zusammenhang zwar als Gliederungssignale verwendet, transportieren aber 
gleichzeitig als ikonostilistisches Mittel etwas, das man mit Fix (2004: 47) als 
„Zweitsinn“ bezeichnen könnte. Die strukturierende Wirkung beruht sonach auf 
der Basis der oben genannten Funktionen (vgl. Imo 2015b: 153) und ist nur in 
seltenen Fällen mit der Funktion von Satzzeichen gleichzusetzen (vgl. oben 
Anm. 4). Folgendes Beispiel (Abb. 9) soll diese Funktion kurz illustrieren. Es 
handelt sich um den Anfang einer Interaktion, in der Sebastian zum gemeinsa- 
men Fußballgucken lädt. 


23.04.14, 09:49:53 Sebastian23: Heute Abend Fußball bei mir! “© nimmt alles mit was 
ihr haben wollt ® selbst mein geheimnisvoller 


Mitbewohner Henrik22 ist da ® 
23.04.14, 09:53:10 Sebastian23: *nehmt 
23.04.14, 10:02:54 Marie23: Ich schau mal wie ich mit meinem Referat voran 


komme “ 


Abb. 9: Strukturierung (Datenset WA-1) 
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4.2.7 Funktionstyp vii: Darstellung 


Diese Funktion basiert auf der Tatsache, dass Bildzeichen sprachliche Zeichen 
unterschiedlicher Komplexität ersetzen können, womit eine Bezugnahme auf 
außersprachliche Entitäten möglich ist. Das Emoji bzw. mehrere dieser über- 
nehmen die „Referenzfunktion“ (Schlobinski/Watanabe 2003: 30). In vielen 
Fällen werden dazu Emojis, die in den meisten Fällen konkrete Dinge oder Le- 
bewesen abbilden, „anstelle eines Wortes, eines Wortteils oder einer Wortgrup- 
pe eingefügt“ (Dürscheid 2016: 459; vgl. Dürscheid/Frick 2014: 174; Siever 2015: 
293-294). Abstrakta oder Kollektiva bildlich darzustellen erweist sich hingegen 
als ungleich schwieriger (vgl. Siever 2016: 36). Nach Ansicht einiger AutorInnen 
können auch „ganze Propositionen (...) in Emojis ausgedrückt werden“ (Siever 
2015: 295; vgl. Herring/Dainas 2017; Siebenhaar i.Dr.), was angesichts des feh- 
lenden Prädikationspotenzials von Emojis ein durchaus schwieriges Unterfan- 
gen darstellt. Erforderlich ist seitens des Rezipienten in jedem Fall eine „zusätz- 
liche Interpretationsleistung“, weil er/sie die Bildzeichen nicht nur in den 
umgebenden (verbalen) Text einbetten muss (Dürscheid/Frick 2014: 174). Prob- 
leme können bekanntermaßen zudem aus dem Faktum resultieren, dass Bilder, 
so klein sie auch sein mögen, „zu Bedeutungsüberschuss und Mehrdeutigkeit“ 
(Stöckl 2008: 172) neigen und somit für die Rezipienten ein sehr viel größerer 
Interpretationsspielraum eröffnet wird, als vergleichsweise bei der verbalen 
Darstellung (vgl. Dürscheid 2016: 459). Darüber hinaus sind Emojis zwar vielsei- 
tig kombinierbar, können aufgrund fehlender Syntax und Morphologie allein 
aber keine eindeutigen oder komplexen Propositionen aufbauen, was im Zu- 
sammenspiel mit verbalen Segmenten zumindest ansatzweise vorstellbar wäre 
(vgl. Siebenhaar i.Dr.). Ohne textuelle Einbindung hingegen bleibt das Spekt- 
rum möglicher Lesarten weitgehend offen. Unabhängig von den aufgeführten 
Konsequenzen des referierenden Emoji-Gebrauchs scheint sich das Phänomen 
des „piktorale[n] Schreiben[s]“ (Dürscheid/Frick 2016: 105) bzw. der „ikonogra- 
phetische[n] Kommunikation“ (Siever 2015: 281) in der WhatsApp- 
Kommunikation durchaus auszubreiten, was auch neuen technischen Rahmen- 
bedingungen geschuldet sein könnte (Emoji Prediction, SpeakEmoji). Die fol- 
genden Beispiele sollen sowohl die angesprochenen Probleme als auch die 
Potenziale dieses Schreibstils illustrieren. 
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06.03.2015, 11:10 Pia: Mädels drückt mir mal die Daumen... Hab mich auf was 
bestimmtes ziemlich cooles beworben und bekomme am 16. 


Bescheid A 


Meine Chancen stehen laut der Verantwortlichen nicht 
schlecht. 
Egal ob es geklappt hat oder nicht, ich sag euch dann 


Bescheid was es ist © 


06.03.2015, 11:13 Lea: © © daumen gedrückt! Und wenn die dich nicht 
nehmen: Ø > 
06.03.2015,11:14 Pia: ® danke! ® 


06.03.2015, 11:17 Pia: Das ist wahre Freundschaft. Wer böse zu uns ist wird 
erschossen und gesprengt ®. Oder die Bombe wird 


erschossen, das ist noch nicht abschließend geklärt = 


Abb. 10: Darstellung 1 (Datenset WA-1) 


Dieser Ausschnitt (Abb. 10) bildet den Anfang einer Interaktion, in der Pia über 
eine Bewerbung berichtet, deren Ergebnis sie in wenigen Tagen erfahren wird. 
Lea signalisiert im darauf folgenden Beitrag ihre Verbundenheit durch die drei 
geballten Fäuste, deren Bedeutung bzw. Funktion durch die anschließende 
Formulierung „daumen gedrückt“ disambiguiert wird. Bereits hier wird das 
Problem piktoralen Schreibens deutlich: Die Interagierenden können sich ob 
der fehlenden bzw. mehrdeutigen Bedeutungszuschreibungen nicht sicher sein, 
ob ihr Gegenüber die Bilder genau so versteht, wie sie vom Produzenten inten- 
diert sind. Dies gilt umso mehr für die syntaktisch frei gestellten Bilder einer 
Bombe und einer Pistole. Deren Gebrauch wird - nach dem durch das (freund- 
schaftliche) Kuss-Emoji begleiteten Dank - von Pia durch das Tränen-Lach- 
Emoji in einem ersten Schritt goutiert, worauf sie im folgenden Schritt die in- 
haltlichen Interpretationen oder besser, die möglichen Interpretationen spiele- 
risch-metakommunikativ entfaltet. Begleitet werden die Offerten jeweils von 
modalisierenden Emojis, die das Spaßhafte der Interpretationsarbeit herausstel- 
len. Zu sehen sind an diesem Beispiel sehr gut selbst- und fremdinitiierte Inter- 


16 Freilich gibt es im Netz eine Reihe von Seiten und Angeboten, die die Bedeutung von Emo- 
jis erklären (z.B. https://www.smileybedeutung.com/whatsapp-smileys-bedeutung/). Inwie- 
weit aber der/die „durchschnittliche“ WhatsApp-Nutzer(in) derlei Angebote nutzt, ist durchaus 
fraglich. 
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pretationsprozesse in denen die Emojis als Teilnehmerkategorie interaktiv rele- 
vant gesetzt und ausgehandelt werden.” 


Wollen wir nochmal einen Tri 
wagen? 5:5 


Hab Spee als Vollwaschzeug geholt (&) 


is 


EY 


Kein Netz! DG 


Netz!!!! 
Gerade mal wieder nicht 


??? 


Komisch 
Jetzt klappt es 


Wann meinste denn?” eo , wy 


Abb. 11: Darstellung 2 (Datenset WA-2) 


In Abbildung 11 geht es mir in erster Linie um den ersten und letzten Beitrag. A 
unterbreitet zu Beginn den initiativen Vorschlag/die Frage, ab man denn viel- 
leicht einmal wieder verreisen wolle. Die direkt folgende Äußerung von B stellt 
keinerlei Bezug dazu her, die darauf folgende wäre hingegen unter der Voraus- 
setzung responsiv, dass der Daumen und das lachende Gesicht sich wohlwol- 
lend/zustimmend auf die initiative Sequenz bezieht (möglich wäre aber auch 
ein Kommentar zum eigenen Beitrag, der nahezu zeitgleich auch von B mit den 
drei klatschenden Händen bewertet wird). In der Folge wird eine Art Parallelin- 
teraktion etabliert, in der scheinbare Netzprobleme thematisiert werden, die ob 


17 Auf die Vorschläge von Pia wird in dem mir zur Verfügung stehenden Ausschnitt seitens 
Lea allerdings nicht weiter eingegangen. 
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ihrer digitalen Bearbeitung aber als abwegig erscheinen, was A durch die drei 
Fragezeichen auch kenntlich macht. Nach dieser verwirrenden Einschubse- 
quenz stellt B die Frage „Wann meinste denn?“, die an dieser Stelle kaum inter- 
pretierbar ist. Sinn und Relevanz erhält die Frage erst durch die beigefügte Bild- 
zeichenkombination aus Palme, Sonnenbrillengesicht und Sonne, die den 
Urlaub-Frame" aufruft (vgl. Siever 2015: 296) und somit Bezug nimmt auf die 
Eingangsfrage von A. Der doch recht späte Bezug wird unterstützt durch die 
medialen Rahmenbedingungen, die das sequenzielle Rückverfolgen „auf einen 
Blick“ ermöglichen. Die verwendeten Emojis verweisen auf den oben erwähnten 
Trip. Die damit realisierte Antwort wäre ohne diese spezifische Form der Refe- 
renzanbindung schlechterdings möglich, d.h. es gibt einen Referenzankerpunkt 
(„Trip“) und die Emojis übernehmen die Funktion einer visuellen Anapher. 
Realisiert wird demzufolge eine explizite Wiederaufnahme (vgl. Brinker et al. 
2014: 29-36) in Form einer intermodalen Substitution. Verwendet wird dazu 
eine Kombination aus Emojis, die das Potenzial besitzt, als konventionalisiertes 
Zeichen die Bedeutung ‚Urlaub (im Süden)‘ vermitteln zu können (vgl. das Bei- 
spiel in Siever 2015: 296), durchaus mit der Tendenz zu einem Prototypen. Mit 
dem Beispiel kann zudem gezeigt werden, dass Emojis neben dem Bezug auf 
außersprachliche Entitäten auch die Referenz auf Vorerwähntes erlauben, und 
zwar selbst dann, wenn der Bezugsausdruck sequenziell in einiger Ferne zu 
verorten ist, was wiederum die medialen Rahmenbedingungen ermöglichen. 
Und: Der Wechsel zwischen den Modi ist abermals das Resultat einer Wahl und 
dient somit der Vermittlung stilistischen Sinns bzw. sozialer Bedeutung (vgl. Fix 
2004: 43), der/die durchaus auf andere Funktionen hindeuten mag. Gleichwohl 
ist die Referenzfunktion, realisiert durch die bildliche Darstellung, hier die do- 
minierende. 


4.2.8 Funktionstyp viii: Ludische Funktion 


Im folgenden Beispiel (Abb. 12) geht es um eine Verabredung bzw. die Mittei- 
lung, dass man sich zu dieser verspäten werde, weil man im Stau steht. In unse- 
rem Zusammenhang von Interesse sind die folgenden drei Hühner, deren Auf- 
treten an dieser Stelle (nicht nur) für den Außenstehenden doch relativ 
unvermittelt daherkommt und auf dem ersten Blick sinnfrei wirkt. Ob der feh- 
lenden Folgeäußerung (an dieser Stelle ist die Interaktion beendet, die Beteilig- 


18 Auf die Frame-Theorie/Frame-Semantik kann an dieser Stelle nicht eingegangen werden. 
Ausführlich dazu Ziem (2008) und Busse (2012). 
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ten harren des Treffens) ist eine Interpretation für den Analysierenden schwie- 
rig bis unmöglich. Naheliegend jedoch sind Parallelen zu den von Androutsop- 
oulos/Schmidt (2002: 60) beschriebenen „Momentaufnahmen“, deren Anlass 
„typischerweise eine für den Sender aktuelle Situation der Langeweile oder 
Nichtaktivität oder eine Übergangsphase“ ist, wozu auch der Aufenthalt im Stau 
zählt. Derlei Beiträge „sind oft phatisch, reflexiv und ludisch geprägt und bieten 
Freiraum zur spontanen-assoziativen Interaktion“ (Androutsopoulos/Schmidt 
2002: 60). Im vorliegenden Fall präsentiert die Schreiberin eine Art Rätselbild, 
das die Phantasie der Kommunikationspartnerin herausfordert. Leider bleibt 
deren Interpretation (wahrscheinlich) aufgrund des bald stattfindenden Tref- 
fens aus. Infolgedessen wurde die Versenderin der Hühnchen-Bilder gebeten zu 
erläutern, was mit den Hühnern gemeint sei. Ihre Antwort (per Whats-App an 
die Interaktionspartnerin): „hahahaha keine ahnung, vielleicht hab ich meine 
geschwindigkeit mit der von 3 im stau stehenden hühnchen assoziert“ (Schrei- 
bung im Original). Demnach produzierte sie eine bildlich realisierte Metapher 
für Langsamkeit, und zwar in durchaus origineller Art und Weise. Offenbar 
ermöglichen die medialen Rahmenbedingungen im Allgemeinen und die prob- 
lemlose Verfügbarkeit von Emojis im Besonderen über Sprachspiele hinaus 
auch Bildspiele, und zwar nach dem Motto: die Bilder sind einsatzbereit, mal 
schauen was passiert, wenn ich sie nutze. Es handelt sich also um einen kreati- 
ven und spielerischen Umgang mit Emojis, d.h. um eine Art „Spaß- und Scherz- 
kommunikation, die im Austausch von Sprüchen, Witzen, lustigen Bilddateien 
sowie in spontanen Sprach- und Zeichenspielereien o. ä.“ (Wyss/Hug: 2016: 263; 
vgl. Siebenhaar i.Dr.) besteht. Sicherlich finden wir auch hier Momente der 
Modalisierung. Im Unterschied zu der oben beschriebenen Funktion fehlt in 
solchen Fällen aber die Bezugnahme auf den (in den meisten Fällen voranste- 
henden) Text, der modalisiert wird, so dass eine diesbezügliche Interpretation 
(sowohl seitens der Rezipienten als auch seitens des Analysierenden) wohl 
recht problematisch ist. Dass es sich auch bei der ludischen Funktion um Form 
der Beziehungsarbeit handelt, ist insofern offenkundig, als man solche „Spiel- 
chen“ nur in vertrauter Umgebung offerieren wird. 


19 Beide SchreiberInnen wurden über den Verwendungszweck ihrer Daten bzw. hinsichtlich 
des Forschungsgegenstandes/-ziels im Dunkeln gelassen, ihre Erklärungen wurden in keinster 
Weise elizitiert oder gar manipuliert. 
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ey ich brauch so 10 min | 
Lager &9 


Abb. 12: Ludische Funktion (Datenset WA-2) 


4.2.9 Funktionstyp ix: Ausschmückung 


NEE oa —  _ 

Bald müsstest du auch da 
sein. Ich sitze jetzt gerade in 
der Küche mit Memphis und 
gehe gleich baden und dann 
sofort auf den ausziehbaren 
Sessel:D 

Freu mich jetzt schon auf 


den früüüühin ð S & Q 
a = ja 19:09 wv 


Abb. 13: Ausschmückung (Datenset WA-2) 


Zum Schluss möchte ich noch einen Funktionstyp kurz vorstellen, auf den in 
bisherigen Untersuchungen unter den Bezeichnungen/Beschreibungen „Deko- 
rationsfunktion“ (Siever 2015: 297) bzw. „Illustration der Äußerung“ (Dür- 
scheid/Frick 2016: 105) Bezug genommen wurde. Aus einer genuin stilistischen 
Perspektive handelt es sich bei der Ausschmückung um ein traditionelles rheto- 
risch-stilistisches Verfahren (ornatus, vgl. Ueding 2009: 10), das fraglos auch 
durch den Gebrauch von Emojis realisiert werden kann. Mit ihnen ist es mög- 
lich, Aussagen, in vielen Fällen auch Wünsche (vgl. Arens 2014: 89; Siever 2015: 
297), in pointierter und emotionaler Weise zu garnieren, sodass dem mehr oder 
weniger sachlichen Gehalt unterhaltende und/oder euphorische Elemente bei- 
gefügt werden, mit denen die Interaktionspartner auf gewisse Weise eingeladen 
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werden, in die Gefühlswelt des anderen einzutauchen. So fungieren die in Ab- 
bildung 13 verwendeten unterschiedlichen Blumenmotive” als klassisches Aus- 
schmückungselement, das der Äußerung zusätzliche Bedeutsamkeit und Emo- 
tionalität einschreibt. Die bildliche Auszierung korrespondiert in diesem Fall 
mit der Buchstaben-Iteration in „früüüühling“, die als „emulierte Prosodie“ 
(Haase et al. 1997: 68) zusätzlich den Nähe-Aspekt unterstreicht. Die kookkur- 
rierenden Stilmittel fungieren in erster Linie als Kontextualisierungshinweise. 
Sie erweitern den Interpretationsrahmen in Bezug auf das singuläre Thema, den 
spezifischen Aktivitätstyp und die Einstellung zum Gesagten. Sie verweisen 
aber eben auch auf die Beziehung der Interaktionspartner (vgl. Androutsopou- 
los/Schmidt 2002: 72), die mittels dieser Hinweise als freundschaftlich-vertraut 
markiert wird, eine Beziehung, in der man Freude gerne teilt. Dass die Emojis 
auch in dieser Funktion zur Ökonomisierung beitragen, wird bei dem Versuch 
deutlich, die „blumige Visualisierung“ verbal auszuformulieren. 


5 Fazit und Ausblick 


Die Studie hat gezeigt, dass Emojis in der schriftlichen WhatsApp-Kommu- 
nikation als ikonostilistische Mittel zur Kontextualisierung sowohl auf der Mak- 
ro- als auch auf der Mikroebene verwendet werden. Emojis sind — insbesondere 
vor dem Hintergrund ihres häufigen Gebrauchs, der zu Beginn dieses Beitrages 
angesprochen wurde - vielleicht sogar „prototypische oder sogar stereotype 
Stilmittel, die stark genug sind, allein ganze Interpretationsrahmen verfügbar 
zu machen“, ganz so, wie dies Selting für bestimmte Stilmittel in der Face-to- 
Face-Interaktion annimmt (Selting 1997: 31). Das würde sowohl die Makroebene 
betreffen, auf der die Emojis als rahmende und beziehungsgestaltende Mittel 
der Ökonomisierung ihre Wirkung entfalten, und zwar im Zusammenspiel mit 
allen anderen herausgearbeiteten Funktionstypen, die jedoch eher auf der Mik- 
roebene operieren, indem sie vorrangig einzelne Aktivitätstypen kontextualisie- 
ren. 

Die vorgelegte Klassifizierung der Funktionstypen ist als vorläufige zu ver- 
stehen, vor allem weil Emojis in allen Klassen mehrere Funktionen erfüllen, von 


20 Die Verwendung der Blumen als Ausschmückung inklusive der simulierten Dehnung 
durch Iteration scheint im Zusammenhang mit Frühling(sgefühlen) bereits konventionalisiert, 
u.U. eventuell prototypisch zu sein, worauf u.a. die Beispiele von Dürscheid/Frick (2014: 174, 
2016: 104f) hinzudeuten scheinen, die beide vom hier präsentierten lediglich in Nuancen ab- 
weichen. 
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denen jeweils nur die dominierende bestimmt wurde. Funktionstypübergrei- 
fend dienen Emojis in erster Linie der interaktiven Herstellung konzeptioneller 
Mündlichkeit. Dabei ergänzen oder ersetzen sie andere Elemente, die kenn- 
zeichnend für die konzeptionelle Mündlichkeit schriftlicher internetbasierter 
Kommunikation sind, wie beispielsweise Diskurs- und Abtönungspartikeln, 
expressive Interjektionen, Inflektive oder auch gruppensprachliche Ausdrücke 
(vgl. u.a. Androutsopoulos 2007; Beißwenger 2016b). Genau wie die verbalen 
Mittel dienen sie der Hervorbringung von Spontaneität, Interaktivität, Vertraut- 
heit, Privatheit und sorgen so für kommunikative Nähe (vgl. Androutsopou- 
los/Schmidt 2002: 66). Flankiert wird dies in den meisten Fällen durch das spie- 
lerische Moment, das mit dem Emoji-Gebrauch einhergeht. Trotz der hiermit 
angedeuteten fehlenden Trennschärfe liefert die (vorläufige) Kategorisierung 
aber doch zumindest Ansatzpunkte für weiterführende Arbeiten mit anderen, 
umfangreicheren Sets/Korpora, an denen sie überprüft, ergänzt und modifiziert 
werden kann. 

Desweiteren wurde gezeigt, dass der Zeichencharakter von Emojis funkti- 
onsabhängig zwischen ikonisch, indexikalisch und symbolisch oszilliert. So 
überwiegen beim Kommentieren/Evaluieren die ikonischen Anteile, beim Rah- 
men indexikalische und bei der intimen Beziehungspflege symbolische Aspek- 
te, wobei eine klare Trennung sicherlich schwierig bzw. abhängig vom jeweils 
konkreten Gebrauch ist. Zusammengefasst heißt dies, dass Emojis — wie Emoti- 
cons auch - zwar eine gewisse Grundfunktion bzw. Grundbedeutung aufwei- 
sen, sie in der Regel aber nur im Kontext interpretierbar sind (vgl. Imo 2015: 
137). Ausschlaggebend für ihre Interpretation ist immer die konkrete „Ge- 
sprächsfunktion“, die bisweilen erheblich von der „Basisfunktion“ abweichen 
kann (Brinker/Sager 2010: 58; vgl. Beißwenger et al. 2012). Die Bedeutung bzw. 
Funktion von Emojis ist gleichsam ihr Gebrauch in der Interaktion. Die Analyse 
der Funktion hat sich somit in erster Linie an Aufzeigeaktivitäten bzw. sequen- 
ziellen Bezügen der Interagierenden zu orientieren. Dazu sollten neben interak- 
tionalen Ansätzen auch multimodale in Anschlag gebracht werden (Imo i.V.; 
Dürscheid 2016; Herring 2015), wobei eine Einbettung in oder Ergänzung durch 
ethnografische Forschungsdesigns (Schmidt/Androutsopoulos 2004) und/oder 
Produktionsanalysen (Beißwenger 2007, 2010) in hohem Maße sinnvoll wäre. 
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Clay Spinuzzi 

Analyse computervermittelter 
Kommunikation in Arbeitsumgebungen: 
ein tätigkeitstheoretischer Ansatz 


1 Einleitung 


Dialogbasierte computervermittelte Kommunikation [dialog-based computer- 
mediated communication]! (CMC), wozu hier soziale Netzwerk-Dienste, Instant 
Messaging, Wiki, E-Mail und anderes gerechnet wird, wurde in der jüngeren 
Vergangenheit zunehmend in professionelle Umgebungen integriert, sowohl 
‚offiziell‘ (als Tools, die die Zusammenarbeit und Koordination von Mitarbeitern 
unterstützen) als auch ‚inoffiziell‘ (als zusätzliche Kommunikationsebene für 
Mitarbeiter (vgl. Backhouse 2009; Baehr & Alex-Brown 2010; Bhatti/Baile/Yasin 
2011; Brzozowski/Sandholm/Hogg 2009; Cummings/Massey/Ramesh 2009; 
Jacobs/Nakata 2010; McNely 2009; Muller et al. 2010, 2012; Riemer/Richter 2010; 
Wagner 2010; Zhao/Rosson 2009). Darauf bezogene Studien fokussieren häufig 
ein spezifisches CMC-Genre. 

Im Forschungsbereich ‚Kommunikation in Arbeitskontexten’ [professional 
communication] nutzen ForscherInnen seit langem Fallstudien, ethnographi- 
sche Studien und andere Formen der Feldforschung, um besser zu verstehen, 
wie MitarbeiterInnen in professionellen Umgebungen kommunizieren, koope- 
rieren, sich koordinieren und Probleme lösen (z.B. Anson/Forsberg 1990; 
Doheny-Farina/Odell 1985; Doheny-Farina 1992; Henry 2000). Diese Studien 
haben bestimmte Nachteile: Sie arbeiten häufig mit geringen Teilnehmerzahlen, 
sind oft schwer verallgemeinerbar, erzeugen tendenziell stark kontextabhängi- 
ge Daten und liefern - bei unzureichender methodischer Erfahrung - zuweilen 
eher anekdotische Evidenz als systematische Analysen. Feldforschung hat je- 
doch auch Vorteile: Sie ermöglicht eine „offene“, d. h. strikt beobachtungsba- 
sierte Erhebung der Arbeitspraktiken von Mitarbeitern und liefert eine dichte 


1 Die Übersetzung des Beitrags ins Deutsche besorgten Eva-Maria Jakobs, Lisa Höller und 
Stephan Elspaß. Bei der Übersetzung wurden zentralen Termini in eckigen Klammern die 
korrespondierenden englischen Entsprechungen beigestellt, um die Lokalisierung der damit 
verbundenen theoretischen Konzepte in der englischsprachigen Forschungsliteratur zu er- 
leichtern. 


DOI 10.1515/9783110567786-008 


214 — Spinuzzi 


Beschreibung dieser Arbeitspraktiken. Sie deckt ideosynkratische und unerwar- 
tete Formen der Nutzung von Ressourcen auf und zeigt, wie Ressourcen wohl 
aufeinander abgestimmt genutzt werden können, um Arbeitsprozesse zu unter- 
stützen (z. B. Hutchins 1995; Latour 1996, 1999). Allgemeiner formuliert kann 
Feldforschung die Komplexität von professionellen Umgebungen aufzeigen, 
insbesondere Anzahl und Art der vermittelnden Instanzen sowie die Beziehun- 
gen zwischen ihnen (einschließlich von, aber nicht begrenzt auf CMC- 
Technologien und -Genres). Diese Art von Feldforschung ist häufig in eine 
soziokulturelle Theorie eingebettet. 

Der Beitrag beschreibt eine Forschungsrichtung, der David Russell (2009) 
den Namen Writing, Activity, and Genre Research (WAGR) gegeben hat. Ich wer- 
de insbesondere auf drei analytische Konstrukte eingehen, die in der WAGR- 
Tradition für die Analyse von Wechselbeziehungen zwischen Texten in profes- 
sionellen Umgebungen (einschließlich dialogbasierter CMC) entwickelt wurden, 
und diese am Beispiel einer exemplarischen Fallstudie beschreiben. Die Fall- 
studie wird hier lediglich zu Illustrationszwecken verwendet; für methodologi- 
sche Details verweise ich auf Spinuzzi (2010). Abschließend diskutiere ich die 
Herausforderungen und potenziellen Vorteile von CMC-Genres, die sich erge- 
ben, wenn sie in Arbeitsabläufe integriert werden - insbesondere, wie eine 
derartige Integration Kontingenz, d. h. unvorhersehbare Faktoren, adressiert, 
die typisch ist für sich schnell verändernde Arbeitsumgebungen. 


2 Ein Beispiel: Fragen und Fragen beantworten 
bei Semoptco 


Die Fallstudie, auf die ich mich im Folgenden beziehe, wurde bei einem Inter- 
net-Marketing-Unternehmen durchgeführt, das ich Semoptco nenne (Spinuzzi 
2010). Mich interessierte, wie die Arbeitnehmer ihre Projekte managen. Daher 
verbrachte ich drei Monate damit, vier MitarbeiterInnen bei ihrer Arbeit zu be- 
obachten, sie zu interviewen und ihre Arbeit zu untersuchen. 

Sehen wir uns ein Beispiel aus der Fallstudie genauer an: Eines Tages be- 
obachtete ich zwei Mitarbeiter, die in einem Team arbeiteten. Sie teilen sich eine 
Arbeits-Box in einem Großraumbüro, jeder sitzt mit seinem Computer in einer 
Ecke der Box, dem anderen den Rücken zugekehrt (vgl. Abbildung 1). 
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Abb. 1: Carl (links) und Luis (rechts) teilen sich eine Arbeits-Box. Wichtig: Beachten Sie die 
vielen Texte „außerhalb“ des Bildschirms. 


Luis (rechts) hat eine Frage, die er mit Carl (links) klären möchte. Als er sich 
umdreht, bemerkt er, dass Carl Kopfhörer trägt (in Abbildung 1 nicht zu sehen). 
Also wendet er sich wieder seinem Monitor zu, schaut dann erneut zu Carl und 
dreht sich danach wieder um. Schließlich schreibt er Carl — der weniger als 
einen Meter entfernt von ihm sitzt (!) - eine Instant Messaging-Nachricht. Carl 
erhält die Nachricht und liest sie. Anstatt sich umzudrehen und mit Luis zu 
sprechen, tippt er eine Antwort. Luis liest Carls Nachricht und schickt eine 
Nachricht zurück. Am Ende beginnt Carl zu lachen, er nimmt seinen Kopfhörer 
ab und dreht sich um zu Luis’ Arbeitsplatz, wo sie sich gemeinsam die Notiz im 
System ansehen, zu der Luis eine Frage hat. 

Die Szene mag amüsant wirken, sie ist aber durchaus nicht unüblich. Fall- 
studien zeigen, dass Arbeit typischerweise vermittelt [mediated] ist, jedoch 
nicht durch einzelne Tools, sondern durch Systeme von Tools (Hutchins 1995 
u.a.). Die Systeme tendieren dazu, verschiedene Ressourcen zu umfassen - 
einige werden vom Arbeitgeber vorgegeben, andere sind in einem bestimmten 
Berufsfeld Standard, andere entstehen in der Arbeitsgruppe und wieder andere 
werden von Mitarbeitern opportunistisch bzw. ideosynkratisch übernommen. 
Diese Bandbreite ermöglicht dem System genutzter Ressourcen zum einen Sta- 
bilität, zum anderen sorgt sie für Flexibilität, um auf unvorhersehbare Faktoren 
[contingencies] reagieren zu können. Die Ressourcen schließen zunehmend 
digitale Ressourcen ein, insbesondere CMC-Ressourcen — wie die Instant Mes- 
saging-Applikation, die Luis und Carl nutzen. Die digitalen Ressourcen stehen 
jedoch noch in Beziehung zu den vorhandenen nicht-digitalen Ressourcen - 
wie die in Abbildung 1 sichtbaren nicht-digitalen Texte. 

Wenn Mitarbeiter diese Ressourcen gewinnbringend zu Systemen verknüp- 
fen (Spinuzzi 2008), können diese Systeme Resultate erzeugen, die ihre einzel- 
nen Komponenten nicht zu erzeugen vermögen. In unserem Beispiel bauen Luis 
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und Carl Redundanz in ihr System ein, indem sie Instant Messaging als Ersatz 
für ein persönliches Gespräch verwenden; sie wechseln fließend von einer Res- 
source zur anderen, indem sie sich einer dritten Ressource zuwenden — der 
Notiz, zu der Luis eine Frage hatte. Tatsächlich zeigen längere Auswertungsrei- 
hen, dass die Mitarbeiter des Unternehmens viele Ressourcen miteinander ver- 
binden, um ihre Aufgaben zu erledigen und mit unvorhersehbaren Faktoren 
umzugehen. Wie wir gleich sehen werden, umfassen die Ressourcen eine Reihe 
von CMC-Genres, aber auch viele andere Ressourcen wie Ausdrucke, Haftnoti- 
zen, Textmarker, Listen und Meetings. Die Ressourcen vermitteln gemeinsam 
die Tätigkeiten der Mitarbeiter; Erklärungen für ihre Nutzung sind in den Bezie- 
hungen der Ressourcen untereinander zu suchen, d. h. darin wie die Kombina- 
tion von Ressourcen die Arbeit vermittelt (Spinuzzi 2003a). 

Zu beachten ist, dass der Fokus auf die Beziehungen zwischen Genres [inter- 
genre relationship] den WAGR-Zugang von der CMC-Forschung unterscheidet, 
die sich auf Interaktionen in einem speziellen Genre oder einem speziellen Me- 
dium konzentriert (z. B. Ferschke/Daxenberger/Guryevich 2013; Mehler/ 
Pustylnikov/Diewald 2011; Zesch 2012; kritisch Androutsopoulous 2011). Damit 
verzichtet der WAGR-Zugang auf detaillierte Analysen einzelner Genres und auf 
eine Modellierung, die durch die gründliche Untersuchung einzelner Genres 
möglich wäre, zugunsten einer stärker kontextualisierten Analyse, deren Fokus 
sich darauf richtet, zu verstehen, wie Tätigkeiten durch Systeme miteinander 
verbundener Genres vermittelt werden. 

Der Zeitpunkt für derartige Forschungsarbeiten ist günstig, da Mitarbeiter- 
Innen - ähnlich wie die meisten von uns - zunehmend CMC als nützliches Set 
von Ressourcen nutzen, inklusive Social Media, Instant Messaging, Foren, in- 
terne Blogs, Wikis und zentral(-isiert-)e Informationssysteme (z. B. Wissensma- 
nagementsysteme, die jeder im Unternehmen nutzt). Um diesen Zugriff auf 
CMC-Technologien in Arbeitsumgebungen besser zu verstehen, müssen wir uns 
drei Dinge klarmachen: 

1. In professionellen Umgebungen ist CMC kein Selbstzweck. MitarbeiterInnen 
betreiben nicht Instant Messaging (IM) um seiner selbst willen - sie ver- 
wenden IM, um Fragen zu stellen, um Präsentationen zu koordinieren, um 
in Erfahrung zu bringen, ob ein Kollege im Büro ist etc. Sie „bloggen“ auch 
nicht — sie nutzen interne Blogs, um Informationen auszutauschen. Sie 
„posten“ keine Status-Updates - sie verwenden Status-Updates [work- 
stream], um andere Mitglieder ihrer Arbeitsgruppe wissen zu lassen, wie 
weit sie im Arbeitsablauf fortgeschritten sind. CMC ist nicht das Ziel ihrer 
Arbeit, sondern ein Tool. 
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2. CMC bietet zusätzliche Kommunikationsmöglichkeiten in Arbeitsumgebun- 
gen, die an sich bereits „medienreich“ sind. Tatsächlich verlassen sich die 
MitarbeiterInnen, wenn sie kommunizieren, sich koordinieren und kollabo- 
rieren, auf viele verschiedene Genres, die miteinander interagieren, um zyk- 
lische Tätigkeiten zu vermitteln. 

3. CMC ist Teil der Arbeitstätigkeit. Um zu verstehen, wie und warum Men- 
schen CMC in professionellen Umgebungen verwenden, müssen wir die Tä- 
tigkeiten verstehen, bei denen sie diese Werkzeuge einsetzen. 


Damit stellen sich weitere Fragen: Wie können wir verstehen, wie sich Ressour- 
cen-Systeme entwickeln und wie einzelne Ressourcen, einschließlich CMC- 
Ressourcen, sich aufeinander beziehen? Und wie können wir neue Einblicke 
darin gewinnen, wie CMC in professionellen Umgebungen verwendet und wei- 
terentwickelt wird? 


3 Writing, Activity, and Genre Research (WAGR) 


Der Forschungsansatz Writing, Activity, and Genre Research (WAGR) stützt sich 
auf zwei theoretische Linien - die Tätigkeitstheorie und die nordamerikanische 
Genre-Theorie — und synthetisiert sie. Ich habe diesen Ansatz übernommen und 
in mehr als 15 Jahren Forschung weiterentwickelt. Im Folgenden stelle ich die 
beiden Theorien sowie ihre Verbindung im WAGR-Ansatz vor. 


3.1 Tatigkeitstheorie 


Die Tätigkeitstheorie ist ein soziokultureller Zugang zum Verständnis zykli- 
scher, gemeinschaftlicher, menschlicher Tätigkeit. Sie wurde im Laufe des 20. 
Jahrhunderts entwickelt, ausgehend von Vygotskys (1962, 1978) frühen Arbeiten 
zu toolgestützter Mediation, fortgesetzt durch Leont’evs (1978) Erweiterung des 
Konzepts der Mediation auf gemeinschaftliches, kooperierendes Handeln und 
weitergeführt durch die Arbeiten von Engeström (1987, 1992, 2008) zur Formali- 
sierung von Widersprüchen, Tätigkeitssystemen und Tätigkeitsnetzwerken 
(ausführlich Spinuzzi 2011). 

Die Tätigkeitstheorie wurde an anderen Orten ausführlich beschrieben (z. B. 
Engeström 1987, 2008; Russel 1997b; Spinuzzi 2003b, 2008, 2011). Wesentlich ist 
der Begriff der Mediation [mediation]. Nach Vygotsky ist jede Beziehung zwi- 
schen einem handelnden Subjekt und einem Objekt durch ein Werkzeug [tool] 
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vermittelt; das Tool kann ein Artefakt oder Sprache sein und prägt die Trans- 
formation in jeweils spezifischer Art. Leont’ev erweiterte das Konzept durch die 
soziale Komponente. Danach ist jede Transformation (eines Objektes durch ein 
Tool und Subjekt) in eine gemeinschaftliche Tätigkeit [activity] eingebettet. In 
der Erweiterung der Theorie — etwa durch Engeström - kam der Aspekt des 
Lernens dazu, d. h. die Frage, wie Lernen in und von Aktivitäten möglich ist 
(Hahne 2010). Es wurde angenommen, dass die Erweiterung bisheriger Kulturen 
auf inhärenten Widersprüchen in Aktivitätssystemen beruht, die nicht nur kon- 
stitutiv, sondern auch lebenserhaltend für das Tätigkeitssystem sind; damit 
einher geht die Frage nach Wandel und Innovation. Kurz formuliert, untersucht 
die Tätigkeitstheorie menschliche Tätigkeit als kollektives Unterfangen, das 
durch technische und psychologische Werkzeuge vermittelt wird, sich kulturell- 
historisch entwickelt und an einem speziellen einvernehmlichen Ziel orientiert 
ist, das zyklisch verfolgt wird, um das gewünschte Ergebnis zu erreichen. Die 
Tätigkeitstheorie ist somit ein materialistischer, entwicklungsorientierter und 
systematischer Ansatz zur Analyse menschlicher Tätigkeit, der mitunter unter 
dem Stichwort Distributed Cognition beschrieben wird (Cole/Engeström 1993). 

Die Analyseeinheit der Tätigkeitstheorie ist das Tätigkeitssystem, das weiter 
unten betrachtet wird. Tätigkeitssysteme entwickeln — wie erwähnt - typi- 
scherweise Widersprüche oder systemische Spannungspunkte in der Tätigkeit. 
Diese Widersprüche sind Orte der Störung, aber auch der Innovation. 

Wichtig für die Diskussion hier ist, dass die Tätigkeitstheorie die Beziehung 
von Individuen zu ihren Zielen als vermittelt betrachtet: Menschen erreichen 
ihre Ziele zyklisch über die Vermittlung durch Werkzeuge. Um sich etwas zu 
merken, macht sich ein Individuum einen Knoten ins Taschentuch oder schreibt 
sich eine Notiz; um einen Schrank zu bauen, verwendet jemand einen Hammer 
und eine Säge; um sich mit anderen zu koordinieren, nutzt er/sie ein Set von 
Kommunikationswerkzeugen, die — wie wir in dem Semoptco-Beispiel gesehen 
haben - Instant Messaging, persönliche Konversation oder Notizen in einem 
geteilten System einschließen können. Bei komplexen Arbeiten müssen Indivi- 
duen mehrere solcher Werkzeuge nutzen, von denen jedes seine eigenen Eigen- 
schaften und seine eigene Entwicklungsgeschichte hat. 

In einer stark von Schriftkultur geprägten Gesellschaft sind viele Werkzeuge 
textuell (wie z. B. Instant Messaging und die System-Notizen, die Carl und Luis 
verwenden, sowie Carls Haftnotizen und Luis’ Kalender in Abbildung 1). Um 
diese Texte in kulturhistorischer Hinsicht besser charakterisieren und ihre Be- 
ziehung zueinander besser beschreiben zu können, nutzen viele Vertreter des 
Forschungsbereichs ‚Professionelle Kommunikation’ die nordamerikanische 
Genre-Theorie. 
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3.2 Die nordamerikanische Genre-Theorie 


Ungeachtet ihres Namens basiert die nordamerikanische Genre-Theorie auf der 
Interpretation der Werke von Michail Bakhtin und des Bakhtin-Kreises (Bakhtin 
1981, 1984, 1986; Medvedev/Bakhtin 1978; Voloshinov 1973) durch nordameri- 
kanische Genre-ForscherInnen (Miller 1984; Bazerman 1988; einen Überblick 
bieten Russell 1997a, 1997b, 2009 und Spinuzzi 2003b). In dieser Tradition wer- 
den Genres nicht strukturell, zusammengesetzt aus bestimmten Texteigenschaf- 
ten, oder als eigenständige Artefakte gesehen. Sie werden vielmehr als Traditio- 
nen der Produktion, Verwendung und Interpretation von Artefakten verstanden 
— Traditionen, die Eingang finden in das Artefakt als eine „form-shaping ideo- 
logy“ (Morson/Emerson 1990: 282-284). Sie erwachsen aus kulturhistorischen 
Tätigkeiten und repräsentieren, reflektieren, stabilisieren und konstituieren 
diese Tätigkeiten. Aus kognitiver Sicht repräsentieren sie das „thinking out“ 
von Lösungen, so wie es auch Artefakte tun (siehe Bakhtin 1984: 270). Zugleich 
repräsentieren sie die Entwicklung und Stabilisierung von Weltanschauungen, 
einschließlich ihrer Werte, Ethik und anderer humanistischer Anliegen 
(Spinuzzi 2003b). Verallgemeinert formuliert sind Genres „artifact types and the 
interpretive habits that have developed around them“ (Spinuzzi/Zachry 2000: 
172). 

Wir können Sprache, Musik, Bilder, Benutzeroberflächen und andere Aus- 
drucksweisen als Instanzen von Genres verstehen. Die Forschung zu Kommuni- 
kation in Arbeitsumgebungen konzentriert sich vorwiegend auf Texte. Das ist 
zum Teil so, weil Schreiben das flexibelste Werkzeug ist, das wir besitzen, und 
weil wir in einer stark schriftorientierten Gesellschaft dazu tendieren, Probleme 
textuell zu lösen. Im Falle wiederkehrender Probleme oder Situationen neigen 
wir dazu, textuelle Lösungen, die wir für eine vorherige Problemversion genutzt 
haben, wiederzuverwenden. Mit der Zeit werden diese typisiert. Das bedeutet, 
wir begegnen einem vertrauten Problem und erzeugen einen Text oder verwen- 
den einen Text erneut, der eine vertraute Lösung bietet. Je typisierter diese Tex- 
te sind, desto leichter ist es, sie mit anderen zu teilen, die vor ähnliche Probleme 
gestellt sind. Mit der Zeit entwickeln sich einige dieser Genres und werden defi- 
nierter, rigider und kontrollierter. Als eine instanziierte Lösung schließen sie 
einen bestimmten Standpunkt und eine bestimmte Logik ein. Besonders wichtig 
ist, dass Genres „tools-in-use“ (Russell 1997a) sind. Das heißt, Genres werden 
von ihren Verfassern und Adressaten interpretiert - und das mitunter sehr un- 
terschiedlich. Wir können Genres nicht über eine reine Betrachtung der Text- 
form verstehen. 
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Die genannten Eigenschaften ermöglichen es Genres, verschiedene Arten 
von Arbeit miteinander zu verknüpfen (Spinuzzi 2008), da sie Menschen bewähr- 
te Wege für die Lösung von Informationsproblemen bieten. Angemessen 
verwendet, können Genres Brücken schlagen zwischen vertrauten und unver- 
trauten Tätigkeiten und es Personen mit unterschiedlichem Hintergrund ermög- 
lichen, Informationen sachgerecht miteinander zu teilen und angemessen zu 
transformieren. Genres haben allerdings auch Nachteile, denn sie implizieren, 
wie angedeutet, verschiedene Logiken und Weltansichten. Außerdem erzeugen 
Menschen ständig neue Genres - und diese Genres basieren nicht unbedingt auf 
denselben Annahmen und Voraussetzungen wie die anderer bereits in Ge- 
brauch befindlicher Genres, was zu Störungen führt. 


4 Die WAGR-Synthese: Drei analytische 
Konstrukte 


Die Forschung, die mit einer Synthese von Tätigkeitstheorie und Genre-Theorie 
in der WAGR arbeitet, entwickelte bzw. adaptierte eine Vielzahl analytischer 
Konstrukte, wie z.B. das Konstrukt der soziotechnischen Systeme [sociotechnical 
systems] (Spinuzzi, Hart-Davidson/Zachry 2006; vgl. Latour/Mauguin/Teil 
1992), der kommunikativen Events [communicative event models] (Hatt- 
Davidson 2002) und der Verfahrenstabellen [operations tables] (Spinuzzi 2003b) 
(Fiir einen Uberblicke vergleiche Hart-Davidson/Spinuzzi/Zachry 2006, 2007; 
Zachry/Spinuzzi/Hart-Davidson 2006, 2007; Zachry/Hart-Davidson/Spinuzzi 
2008; Zachry/Spinuzzi 2009; Spinuzzi 2012c). Im vorliegenden Beitrag diskutie- 
re ich drei analytische Konstrukte — Genre-Okologie [genre ecologies], Tätig- 
keitssysteme [activity systems] und Tätigkeitsnetzwerke [activity networks] - 
und veranschauliche sie anhand der Semoptco-Studie. 


4.1 Konstrukt 1: Genre-Okologie 


Genre-Okologien (bzw. -haushalte) sind ineinandergreifende, dynamische Sets 
von Genres, die gemeinsam Tätigkeiten vermitteln und es dadurch Menschen 
ermöglichen, komplexe Ziele zu erreichen (Spinuzzi/Zachry 2000). Genres ver- 
mitteln eine bestimmte Tätigkeit; sie tun dies jedoch nicht allein, sondern in 
enger Vernetzung untereinander: 
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“To account for variations across instantiations of a given genre, a more robust, ecological 
perspective is required, one that accounts for the dynamism and interconnectedness of 
genres. In particular, we argue, the genre ecology framework must account for how offi- 
cial and unofficial documentation genres are animated by and connected through contin- 
gency; how the documentation’s functionality is consequently decentralized, distributed 
across the ecology; and how ecologies of genres achieve relative stability despite their 
contingent, decentralized nature.” (Spinuzzi/Zachry 2000: 173) 


Das Konstrukt der Genre-Ökologie wurde in verschiedenen Publikationen zu 
professioneller Kommunikation entwickelt (z. B. Abrahamsen et al. 2011; Sher- 
lock 2009; Spinuzzi 2003b, 2008; Swarts 2006; Gygi/Zachry 2010; zu anderen 
Formen von Genre-Verbünden Spinuzzi 2004). 

Um zu verstehen, wie das Konstrukt der Genre-Ökologie funktioniert, wen- 
den wir uns noch einmal Carl und Luis und ihrem Instant-Messaging-Dialog zu. 
Zum Zeitpunkt der Fallstudie beschäftigte das Unternehmen 40 Kundenbetreuer 
und Spezialisten; sechs Spezialisten waren für die Optimierung von Suchma- 
schinen zuständig, z. B. Carl und Luis. 


“Search engine optimization (SEO?) is the process of improving the volume or quality of 
traffic to a web site or a web page (such as a blog) from search engines via ‘natural’ or un- 
paid (‘organic’ or ‘algorithmic’) search results...” (Spinuzzi 2010). 


Wenn Menschen Informationen benötigen, nutzen sie zunehmend Google oder 
andere Suchmaschinen, um diese zu finden. Die White-hat-SEO [search engine 
optimization] ermöglicht es, Suchanfragen von Personen zu identifizieren und 
mit legitimen Methoden dafür zu sorgen, dass eine Website hoch gerankt (d. h. 
weit oben) in den Suchergebnissen erscheint. Die Black-hat-SEO, auch bekannt 
als Snake-Oil-Software, hat dasselbe Ziel, verwendet aber unlautere Methoden. 

Semoptco nutzt die White-hat-SEO. Carl und Luis verbrachten viel Zeit mit 
dem Versuch festzustellen, welche Faktoren die SEO-Ergebnisse ihrer KundIn- 
nen beeinflussen - eingehende Links, Änderungen in Suchmaschinenalgorith- 
men, Merkmale und Inhalt der Kundenwebsite, Maßnahmen der Konkurrenz, 
Nachrichteneinträge sowie neue SEO-Medien und -Methoden. Sie waren Prob- 
lemlöser mit einem außergewöhnlich hohen Ermessensspielraum für Maßnah- 
men zur Verbesserung der SEO-Ergebnisse ihrer KundInnen. 

Carl und Luis sahen sich selbst nicht als Schreiber, obwohl sie ständig 
schrieben. Zu ihren sichtbarsten Arbeitsprodukten gehörte der Monatsrepott. 
Jeder von ihnen war für ca. zehn bis zwölf KundInnen zuständig, was bedeute- 


2 Das geläufige Akronym wird im Folgenden für ,Suchmaschinenoptimierung“ übernommen. 


222 —— Spinuzzi 


te, dass sie pro Monat zehn bis zwölf Reports schrieben; jeder Report umfasste 
ca. 20 Seiten. Das Verfassen der Reporte erfolgte in den ersten zehn Arbeitsta- 
gen jedes Monats. Der Report war das sichtbarste Ergebnis ihrer Arbeit. In ihm 
erinnerten sie KundInnen an lang- und kurzfristige Ziele, beschrieben die Me- 
thoden, die sie verwendet hatten, um diese Ziele zu erreichen, wie auch die 
Faktoren, die die Zielerreichung beeinflusst hatten, meldeten die ungefähren 
Zahlen, die aus ihrer Arbeit resultierten, und legten weitere kurzfristige Ziele 
fest. 

Für die genannten Zwecke enthielt der Bericht festgelegte Abschnitte. In der 
Praxis diente jeder Monatsreport als Vorlage für den Bericht des Folgemonats. 
In der Folge entwickelt sich mit jedem Monat das Genre Monatsreport weiter, 
indem die beiden Spezialisten der Logik des Reports folgten und zugleich des- 
sen Struktur erweiterten, um auf neue, unvorhersehbare Faktoren reagieren zu 
können. 

Darüber hinaus entwickelte sich das Genre in einem Ökosystem anderer 
Genres unterschiedlichen Ursprungs, deren Beziehungen zueinander wir - 
materiell und bezogen auf ihre Entwicklung - erfassen und betrachten können. 
Abbildung 2 zeigt eine Genre-Ökologie, die Luis und Stacy (eine andere Mitar- 
beiterin bei Semoptco) nutzen. Die Darstellung basiert auf den Beobachtungen 
an zwei Tagen der Fallstudie und verortet die verschiedenen in den monatli- 
chen Ablauf der Report-Erstellung eingebundenen Genres. 

Die in Abbildung 2 erfassten Genres machen nur einen kleinen Teil der Gen- 
res aus, die bei Semoptco zur Verfügung stehen (z. B. zeigt die Genre-Ökologie 
nicht die Haftnotizen oder den Kalender aus Abbildung 1). Das Genre-Ökologie- 
Modell ermöglicht, die Zusammenhänge zwischen Genres zu erfassen - ein- 
schließlich wiederkehrender Probleme, die Personen mit speziellen Genres und 
ihren Bezügen zueinander haben. 

Durch Genre-Ökologien können wir untersuchen, über welche Wege Infor- 
mationen durch das System fließen. Wir können verfolgen, wie verschiedene 
Arten von Informationen - inklusive dialogbasierter, computervermittelter 
Kommunikation wie Instant Messaging und E-Mail sowie Notizen im hausintern 
genutzten System (BRILLIANCE) - herangezogen, kombiniert und in kunden- 
spezifischen Reports umgesetzt werden. Die Interaktion zwischen Carl und Luis 
umfasste Instant Messaging, Face-to-Face-Gespräche und BRILLIANCE-Notizen. 
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Abb. 2: Genre-Ökologie bei Semoptco. 


Genre-Ökologien erlauben uns insbesondere zu sehen, wie dialogbasierte CMC- 
Genres eines der interessantesten Phänomene bei Semoptco beeinflussen: In 
diesem stark ungewissen (kontingenten) Umfeld entwickeln sich die Genres 
ständig weiter. Insbesondere der Monatsreport verändert sich mit jeder Wieder- 
holung, indem er auf die steigende Anzahl unvorhersehbarer Faktoren reagiert 
(Spinuzzi 2010, 2012a). 

Abbildung 2 liefert eine Momentaufnahme der bei Semoptco genutzten Gen- 
res. Die Arbeit in der Organisation ändert sich so schnell, dass die Spezialisten 
mitunter bei jedem Report-Erstellungs-Zyklus andere Genres einbeziehen müs- 
sen. In anderen Beobachtungsphasen, als den hier besprochenen, nutzten die 
MitarbeiterInnen Twitter, interne Blogs und Wikis, Telefonkonferenzen, Ver- 
laufsprotokolle und Presseerklärungen; ein Spezialist schlug sogar vor, seine 
Verwandten anzurufen und sie um Rat zu fragen. 

In Genre-Ökologien wie diesen vermitteln Genres gemeinsam Tätigkeiten, 
d. h. sie interagieren, um Tätigkeiten zu unterstützen, die ein einzelnes Genre 
nicht ausreichend unterstützen könnte. Nicht nur jedes einzelne Genre spielt 
eine Rolle, sondern auch ihre Kombination. 
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Genre-Ökologien können offizielle und inoffizielle Genres umfassen. Offizi- 
elle Genres, wie etwa die Bauteile eines Reports (z.B. die „competitor's table“, 
eine Tabelle, die SEO-Ergebnisse der KundInnen mit denen der Konkurrenz 
vergleicht) oder externe E-Mails, repräsentieren die Stimme von Semoptco als 
Organisation und wurden deshalb reguliert. Inoffizielle Genres, wie Anmerkun- 
gen und Instant Messaging, wurden nicht reguliert. Offizielle Genres verleihen 
Arbeit tendenziell Stabilität, inoffizielle Genres dagegen Flexibilität. 

Nicht zuletzt tendieren die Genres dazu, sich in einer Tätigkeit herauszubil- 
den und dann in eine andere übernommen zu werden. Zum Beispiel weisen 
Semoptco-Reporte generelle Merkmale der Tätigkeit des Berichtens auf; das 
Genre Report wurde also nicht neu erfunden. Als Luis sich entschied, seine 
Aufgaben auf einem Arbeitsblatt zu erfassen, und Carl beschloss, dies mit ei- 
nem Texteditor zu tun, kannten sie diese inoffiziellen Genres aus anderen Kon- 
texten und importierten sie in ihre aktuelle Tätigkeit. Da sie von anderen Tätig- 
keiten übernommen wurden, teilen sie mitunter nicht die gleichen Ziele und 
Funktionen oder die gleiche Logik (vgl. Spinuzzi 2003b). 

Einige Genres sind CMC-Genres. In der Fallstudie nutzten z. B. Carl und Luis 
Instant Messaging für die Koordination ihrer Arbeit. Die Studie zeigte, dass 
CMC-Genres, wie Instant Messaging, Blog, E-Mail und Notizen in BRILLIANCE 
den Mitarbeitern- mitunter im Zusammenspiel - in vielerlei Hinsicht halfen, die 
Arbeit in der sich schnell ändernden Branche zu koordinieren und ihr Wissen zu 
konsolidieren (siehe Tabelle 1). 


Tab. 1: CMC-Genres bei Semoptco und Fragen, für deren Klärung sie verwendet werden. 


CMC-Genre Fragen, die das Genre zu beantworten half 
Instant Wer ist da? 
messaging Kannst Du meine Frage schnell beantworten? Können wir etwas für das 


Treffen vorbereiten? 
Können wir uns persönlich treffen? 
Interne Blogs Was habe ich über SEO herausgefunden? 
Was sind bewährte Praktiken für diesen Service (z. B. YouTube)? 
E-Mail Kann der Kunde Inhalte auf der Website verändern/hinzufügen? 
Weiß der Kunde, wie sich diese neue Entwicklung auf ihre SEO auswirkt? 
Vertraut mir der Kunde? 
BRILLIANCE Welche Maßnahmen haben wir bei diesem Projekt getroffen? 
Zu welchen Ergebnissen führten sie? 
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Durch den Einsatz dieser und anderer Genres konnte Semoptco eine ständige 
Abstimmung zwischen den Mitarbeitern gewährleisten, wie sie in kleinen, pro- 
jektbasierten Organisationen üblich ist (Mintzberg 1979). Der Status der gegen- 
seitigen Anpassung wird teilweise durch die Vielzahl an unterschiedlichen 
CMC-Medien ermöglicht, teilweise durch andere Kommunikationsmedien und 
-praktiken. 

Um zu verstehen, wie die Vermittlung durch die genannten Genres funktio- 
niert, betrachten wir im Folgenden das Tätigkeitssystem der im Fallbeispiel 
beobachteten Mitarbeiter. 


4.2 Konstrukt 2: Tatigkeitssysteme 


Das Tätigkeitssystem [activity system] ist eine Gemeinschaft, in der ein Akteur 
oder mehrere menschliche Akteure daran arbeiten, ein Objekt zyklisch umzu- 
wandeln (Rohmaterialien oder Probleme, die durch ihre Transformation einen 
Gebrauchswert erhalten). Die Akteure bearbeiten Objekte, um wiederholt ein 
bestimmtes Ergebnis zu erzielen. Zum Beispiel kann man ein Bauvorhaben als 
Tätigkeitssystem verstehen, in dem Akteure (Bauarbeiter, ein Bauleiter, ein 
Architekt, andere) daran arbeiten, ein Objekt (die Baumaterialien, aus denen 
das Gebäude entstehen soll) so zu verändern, dass sie ein Ergebnis erzielen 
(einen lukrativen Mehrwert für das Gebäude). 

Widersprüche sind systemische Störungen, die sich in Tätigkeiten heraus- 
bilden — manchmal in Teilen von Tätigkeiten, manchmal diese durchziehend 
und manchmal über zusammenhängende Tätigkeiten hinweg (auf diesen Fall 
werde ich noch eingehen). So können die an einem Bauprojekt beteiligten Ak- 
teure unterschiedliche Ergebnisse anstreben: Der Bauleiter möchte das Gebäude 
schnell fertigstellen, der Investor möchte die beste Rückvergütung für seine 
Investition erzielen, und der Architektin liegt daran, dass ein Gebäude entsteht, 
auf das sie stolz sein kann, selbst wenn dies bedeutet, dass Zeitrahmen und 
Budget überzogen werden müssen. Widersprüche können zu Unstimmigkeiten 
und Fehlern führen und die Fähigkeit des Systems, sein Ziel zu erreichen, be- 
einträchtigen. Sie können aber auch Orte für Innovation und Kreativität sein (z. 
B. Spinuzzi 2003b). 

Da Tätigkeitssysteme ein nützliches Gerüst bieten für das Erfassen der Ele- 
mente komplexer, vermittelter, zyklischer Tätigkeiten - einschließlich des Ge- 
genstands der Tätigkeit und der Motive der involvierten Personen — werden sie 
in der Forschung zu professioneller Kommunikation gern genutzt (vgl. u. a. 
Bazerman 1988; Russell 1997a, b, 2009; Gygi & Zachry 2010; Sherlock 2009; 
Spinuzzi 2003b, 2008, 2011). Das Tätigkeitssystem liefert einen Top- oder Makro- 
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Level-Kontext für das Verstehen spezifischer (bewusster) Handlungen und da- 
runter liegender (unbewusster) Operationen (Spinuzzi 2003b). Darüber hinaus 
erlaubt es das Aufdecken systematischer Widersprüche als Ursache von Span- 
nungen, Störungen und Innovationen in der Tätigkeit. Das in der Semoptco- 
Studie entwickelte Tätigkeitssystem-Diagramm basiert auf dem Kodieren und 
Analysieren qualitativer Daten: Interviews, Beobachtungen und Artefakte (Ab- 
bildung 3). 
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Abb. 3: Tatigkeitssystem bei Semoptco. 


Wie die Abbildung zeigt, richtet sich die Tatigkeit auf das Ziel Suchmaschinen- 
ranking des Kunden. An dem Ranking wurde zyklisch gearbeitet, um Monat fiir 
Monat das Ergebnis (die Transaktionen des Kunden) zu verbessern. Der oberste 
Kasten in Abbildung 3 enthalt eine sehr unvollstandige Liste der verwendeten 
Werkzeuge [tools] oder sonstigen vermittelnden Instanzen - die Genre- 
Ökologie. 

Wir sehen noch etwas anderes. Die Suchmaschinen-Optimierung erfolst in 
einer sich schnell verändernden Umgebung, in der sie verschiedenen Interes- 
sensgruppen Gewinn bringen soll: den Kunden (die ihr Suchranking verbessern 
wollen), Kunden der Kunden (die genaue, nützliche Ergebnisse wollen) und den 


Analyse computervermittelter Kommunikation in Arbeitsumgebungen — 227 


Betreibern der Suchmaschinen (die relevante, d. h. keine „Snake oil“-Ergeb- 
nisse wollen). Teil dessen, was die SEO so ungewiss macht, ist, dass die Interes- 
sen der Stakeholder nicht immer in Einklang sind, auch wenn es oberflächlich 
den Anschein hat. 

Tatsächlich führt die ständige Veränderung zu Widersprüchen [contradic- 
tions] im System bzw. in und zwischen seinen Teilen. Diese Widersprüche be- 
stehen zwischen Interessensgruppen, zwischen sich ständig ändernden Regeln 
und Zielvorgaben, zwischen Werkzeugen und dem erwünschten Ergebnis (vgl. 
Abbildung 4). Es ist wichtig anzumerken, dass die Widersprüche Innovationen 
vorantrieben. So führten die sich ständig ändernden Regeln (z. B. sich ändernde 
Algorithmen der Suchmaschine) dazu, dass die SpezialistInnen ständig nach 
neuen SEO-Methoden suchten, und diese intern über Blogs, Wikis und Meetings 
verbreiteten. Um die mit den neuen Methoden verbundenen Veränderungen 
den KundInnen erklären zu können, entwickelten die Spezialisten das Genre 
des Monatsberichts (Spinuzzi 2012a). 

Eine weitere Innovation war die Arbeitsteilung. Semoptco bearbeitete Kon- 
tingenzphänomene durch die Bildung einer Vielzahl von Teams. Um diese 
Teams besser zu verstehen, wenden wir uns dem dritten Konstrukt zu, den Tä- 
tigkeitsnetzwerken. 
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Abb. 4: Widerspriiche bei Semoptco (kursiv gesetzte Anteile der Abbildung). 
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4.3 Konstrukt 3: Tätigkeitsnetzwerke 


Tätigkeitssysteme funktionieren nicht in einem Vakuum. Sie können vielmehr 
als atomare Bestandteile gesehen werden, die sich zu größeren, relativ kohären- 
ten Tätigkeitsnetzwerken [activity networks] verbinden (Miettinen 1998, 1999; 
Miettinen/Hasu 2002; Saarelma 1993). Die Tools der Akteure werden von Her- 
stellern produziert; die Akteure kommen aus verschiedenen Disziplinen, Bran- 
chen und Ausbildungen; ihre Arbeitsgegenstände orientieren sich ggf. an den 
Anforderungen ihrer Disziplin. 

Das Konzept der Tätigkeitsnetzwerke findet sich früh in den Arbeiten von 
Engeström (1987, 1990). In einem Tätigkeitsnetzwerk können ineinander grei- 
fende Tätigkeiten “potentially destabilize each other through their exchanges 
and interpenetrations” (Engeström 1990: 13). In solchen Fällen stehen die darin 
enthaltenen Tätigkeitssysteme in einer Wechselbeziehung. Sie müssen nicht 
konfligieren, lösen aber Spannungen untereinander aus, da es sich um indivi- 
duelle Tätigkeitssysteme handelt mit unterschiedlichen Akteuren, Tools, Re- 
geln, Gemeinschaften, Arbeitsteilungen und angestrebten Ergebnissen. 

Semoptco kann als Unternehmen beschrieben werden, das in eine Kette 
[chain] von Tätigkeitssystemen eingebunden ist (vgl. Abb. 5). Die von Semoptco 
genutzte Instant-Messaging-Software wurde z. B. von einem anderen Software- 
Unternehmen als Arbeitsgegenstand [object] entwickelt und zyklisch weiter- 
entwickelt. Die Software wurde erst bei Semoptco zum Tool. Ähnlich produzie- 
ren Universitäten zyklisch Absolventen, von denen einige Akteure in dem Tä- 
tigkeitssystem von Semoptcos werden. 
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Abb. 5: Semoptco als Teil einer Kette von Tätigkeitssystemen. 


Mitunter überlagern sich Tätigkeitssysteme und bearbeiten wohl abgestimmt 
gemeinsame Gegenstände. Bei Semoptco erforderten ständige Unwägbarkeiten 
die Fähigkeit der MitarbeiterInnen, untereinander Kontakt zu halten, sich zu 
koordinieren und Vertrauen aufzubauen - in und zwischen Abteilungen. Aus 
diesem Grund war jeder SEO-Spezialist Mitglied von sechs separaten Teams; 
jedes Team verfolgte ein bestimmtes Ziel, das in spezifischer Weise zum Ge- 
samtziel der Organisation beitrug. Jedes Team hatte einen anderen Auftrag, eine 
andere Zusammensetzung und ein anderes Set unterstützender Genres, inklusi- 
ve Instant Messaging, E-Mail, Blog und andere CMC-Genres (vgl. Tabelle 2). 
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Tab. 2: Teamtypen (Tätigkeitssysteme) des internen Tätigkeitsnetzwerks von Semoptco. Jeder 
Spezialist war in alle sechs Teamtypen involviert; Kundenbetreuer waren nicht Teil der Sup- 


portteams. 


Teamtyp (Tätig- Beschreibung 


keitssystem) 


Project 


Apprentice- 
ship 


Support 


Functional 


Values 


Taco club 


Teams, die Kampag- 
nen entwerfen und 
durchführen. Die 
Mitglieder arbeiten 
an verschiedenen 
physischen Orten. 


Befreundete Mentor- 
teams, die sich tref- 
fen. (Während der 
Fallstudie im SEO- 
Bereich durch Be- 
treuungsteams 
ersetzt.) 


Teams von drei Kol- 
legen, die sich tref- 
fen, um Leistung und 
Status der Berichte 
festzulegen. 


Teams, die Abteilun- 
gen umfassen: SEO, 
vergütete Suche etc. 


Übergreifend agie- 
rende Teams, die 
zentrale Unterneh- 
menswerte umset- 
zen 

(während der Studie 
initiiert) 
Zweier-Teams, die 
sich mittwochs zum 
Taco-Frühstück 
trafen 


Maßgabe / 
Ziel 


Kunden- 
betreuung 


Ausbildung 


Kontrolle, ob 
der Service 
funktioniert 


Abteilungs- 
aufgaben 


Kulturelle 
Werte 


Abteilungen 
übergreifen- 
des soziales 
Netzwerk 


Zusammenstellung Genres 


des Teams 


Kundenbetreuer; 
1-2 Fachleute, 
vom Vorstand 
gewählt. 


Kundenbetreuer, 
Paare von Exper- 
ten 


Senior Specialist, 
2 Experten 


alle Mitglieder der 
Abteilung 


Mitarbeiter aus 
dem Unterneh- 
men, die sich 
selbst melden 


Mitarbeiter ver- 
schiedener Funk- 
tionsteams, die 
sich selbst melden 


Instant Messaging 
(IM), E-Mail, Mee- 
ting, Telefon- 
konferenz, (unan- 
gekündigte) Besu- 
che... 

informelle Gespra- 
che am Arbeits- 
platz, IM 


(unangekiindigte) 
Besuche, IM, 
E-Mail, Notizen in 
BRILLIANCE, 
Meetings 
»Reporting- 
Parties“; Lunch, 
IM, interne Blogs, 
E-Mail... 


Values team 
meeting; E-Mail 


Taco club meet- 


ing; 
E-Mail 


Die Teams überschnitten sich, wodurch jeder in der Organisation direkten oder 
indirekten Kontakt hatte. Das Set von Teams förderte die Entwicklung „schwa- 


cher Bindungen“ im gesamten Unternehmen. 
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In der Fallstudie wurden die Ziele der Teams für die Realisierung überge- 
ordneter Unternehmensziele des Semoptco Tätigkeitssystems vernetzt. In ande- 
ren Studien umfassten Tätigkeitsnetzwerke mehrere unterschiedliche Organisa- 
tionen mit widersprüchlichen Zielen (z. B. Spinuzzi 2012b, 2014). 


5 Fazit: Zukünftige Entwicklungen in CMC in 
professionellen Umgebungen 


Den Ausgangspunkt dieses Beitrag bildeten die folgenden drei Thesen: 

1. In professionellen Umgebungen ist CMC kein Selbstzweck bzw. Ziel an sich. 

2. CMC bietet zusätzliche Kommunikationswege für professionelle Umgebun- 
gen, die an sich „medienreich“ sind. 

3. CMC ist ein Teil der Arbeitstätigkeit. 


Die diskutierten analytischen Konstrukte - Genre-Okologie, Tätigkeitssystem 
und Tatigkeitsnetzwerk — behandeln CMC in professionellen Umgebungen, 
indem sie Wege bieten, die professionellen Umgebungen kontextuell zu be- 
schreiben und zu analysieren, insbesondere wie Beziehungen zwischen Ressour- 
cen Arbeitsprozesse gestalten. Das heißt, sie helfen uns nachzuvollziehen, wie 
sich Tätigkeiten entwickeln und wie sie dabei Genres übernehmen, adaptieren 
und „improvisieren“, um interne und externe Widersprüche zu bearbeiten. 
Diese Konstrukte können Ausgangs- und Orientierungspunkte für Arbeiten 
liefern, die die CMC-Nutzung in Arbeitsumgebungen untersuchen, insbesondere 
wenn CMC-Genres mit anderen Genres vernetzt werden. 

Abschließend weise ich auf zwei neuere Forschungsprojekte hin, die diese 
Konstrukte nutzen. Sie nutzen die analytischen Konstrukte, um genauer be- 
sründen zu können, wie CMC-Genres in komplexe, zyklisch vermittelte Tätigkei- 
ten eingebunden werden und für diese Zusatz-Funktionen bereitstellen. 

Projekt 1 Public Available Online Services: Die Forschungsgruppe von Mark 
Zachry (University of Washington) untersucht, wie Firmen öffentlich zugängli- 
che Online-Services (z. B. Twitter, Facebook, Google Calendar, Basecamp) ein- 
setzen, um ihre Kommunikation zu erweitern. Das Projekt basiert auf dem Kon- 
zept der Genre-Ökologie und nutzt dieses als Grundlage für die Erarbeitung von 
Typologien und für die Analyse der Übernahme von Online-Services (Di- 
vine/Ferro/Zachry 2011; Ferro et al. 2009; Ferro/Divine/Zachry 2012). Soziale 
Medien sind allgemein zugänglich, in das Leben der Menschen integriert und 
verfügbar über Mobiltelefone, die wir scheinbar ständig bei uns haben. Sie wer- 
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den von Unternehmen zunehmend als zusätzliche Kommunikationsebene in 
informellen wie formellen Kontexten genutzt. Die Forschungsgruppe erwartet, 
dass diese Services auch in Zukunft breite Anwendung finden. 

Projekt 2 Activity Streams: Die Forschergruppe von William Hart-Davidson 
untersucht, wie Tätigkeitsströme [activity streams] - die für Social Media wie 
Facebook und Twitter üblich sind - für die Koordination von Schreibtätigkeiten 
in Arbeitsumgebungen genutzt werden können (Hart-Davidson/Zachry/ 
Spinuzzi 2012; McCarthy et al. 2011). Tätigkeitsströme ermöglichen den Nutzern 
sozialer Netzwerke, anderen ihren Status anzuzeigen. Heute sind sie auch in 
professionellen Umgebungen üblich. Google Docs ermöglicht z. B. Basisinfor- 
mationen zum kollaborativen Arbeiten in geteilten Dokumenten (Was hat der 
andere getan/geändert?). Der von Hart-Davidson und anderen entwickelte An- 
satz erlaubt präzisere Beschreibungen der im Dokument ausgeführten Tätigkei- 
ten, die den Schreibbeteiligten die für die Zusammenarbeit benötigten Kontexte 
ummittelbar erschließbar machen. Das System ist auf zyklische Tätigkeiten 
ausgerichtet (z. B. document cycling). WAGR und seine Konstrukte werden da- 
bei für eine systematische Analyse der Art und Wiese genutzt, wie die Schreiber 
sich aufeinander beziehen. 

Beide Projekte nutzen die im vorliegenden Beitrag vorgestellten Ansätze, 
um genauer zu erforschen, wie CMC-Genres in komplexe, vermittelte Arbeits- 
prozesse integriert werden und wie sie diese funktional erweitern und verän- 
dern. 
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